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Capítulo 1 


Conceptos Básicos 


[LP81, cap 1] 

En este capítulo repasaremos brevemente conceptos elementales que el lector ya debiera 
conocer, y luego introduciremos elementos más relacionados con la materia. La mayoría de 
las definiciones, lemas, etc. de este capítulo no están indexados en el índice de Materias 
al final del apunte, pues son demasiado básicos. Indexamos sólo lo que se refiere al tema 
específico de lenguajes formales, complejidad, y computabilidad. 

No repasaremos el lenguaje de la lógica de predicados de primer orden, que usaremos 
directamente, ni nada sobre números. 


1.1 Inducción Estructural 

En muchas demostraciones del curso haremos inducción sobre estructuras definidas 
recursivamente. La inducción natural que se supone que el lector ya conoce, (-P(O) A ( P(n ) =>■ 
P(n + 1)) =4» Vn > 0, P(n)), puede extenderse a estas estructuras recursivas. Esencialmente 
lo que se hace es aplicar inducción natural sobre alguna propiedad de la estructura (como su 
tamaño), de modo que pueda suponerse que la propiedad vale para todas sus subestructuras. 

Veamos un ejemplo. Un árbol binario es o bien un nodo hoja o bien un nodo interno del 
que cuelgan dos árboles binarios. Llamemos i(Á) y h(A) a la cantidad de nodos internos y 
nodos hojas, respectivamente, de un árbol binario A. Demostremos por inducción estructural 
que, para todo árbol binario A, i(A ) = h(A) — 1. 

Caso base: Si el árbol A es un nodo hoja, entonces tiene cero nodos internos y una hoja, 
y la proposición vale pues i(Á) = 0 y h(A) = 1. 

Caso inductivo: Si el árbol A es un nodo interno del que cuelgan subárboles Ai y A 2 , 
tenemos por hipótesis inductiva que i(Ai) = h(Ai) — 1 y i(A 2 ) = h(A 2 ) — 1. Ahora bien, 
los nodos de A son los de Ai, los de A 2 , y un nuevo nodo interno. De modo que i(A) = 
i{Ai) + i{A 2 ) + 1 y h(A) = h(Ai) + h{A 2 ). De aquí que i{A) = h(Ai) — 1 + h{A 2 ) — 1 + 1 = 
h(Ai) + h(A 2 ) — 1 = h(A) — 1 y hemos terminado. 
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1.2 Conjuntos, Relaciones y Funciones 

Definición 1.1 Un conjunto A es una colección finita o infinita de objetos. Se dice que esos 
objetos pertenecen al conjunto, x E A. Una condición lógica equivale?ite a x E A define el 
conjunto A. 

Definición 1.2 El conjunto vacío, denotado 0, es un conjunto sin elementos. 

Definición 1.3 Un conjunto B es subconjunto de un conjunto A, B C A, si x E B x E 
A. Si además B A, se puede decir B C A. 

Definición 1.4 El conjunto de partes de un conjunto A, p(A), es el conjunto de todos los 
subconjuntos de A, es decir {A", X C A}. 

Definición 1.5 Algunas operaciones posibles sobre dos conjuntos A y B son: 

1. Unión: x E AU B sii x E A V x E B. 

2. Intersección: x E Aíl B sii x E A A x E B. 

3. Diferencia: x E A — B sii x E A A x ^ B. 

4■ Producto: (x,y) E A x B sii x E A Ay E B. 

Definición 1.6 Una partición de un conjunto A es un conjunto de conjuntos B\,... B n tal 
que A = Ui<¿<n Bi y fl Bj = 0 para todo ifij. 

Definición 1.7 Una relación IZ entre dos conjuntos A y B, es un subconjunto de A x B. 
Si (a, b) E IZ se dice también aTZb. 

Definición 1.8 Algunas propiedades que puede tener una relación IZ C A x A son: 

• Reflexividad: Va E A, alZa. 

• Simetría: Va, b E A, aTZb bIZa. 

• Transitividad: Va, b,c E A, aTZb A blZc aIZc. 

• Antisimetría: Va fib E A, aTZb =>■ bIZa. 


Definición 1.9 Algunos tipos de relaciones, según las propiedades que cumplen, son: 

• de Equivalencia: Reflexiva, simétrica y transitiva. 

• de Preorden: Reflexiva y transitiva. 

• de Orden: Reflexiva, antisimétrica y transitiva. 
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Lema 1.1 Una relación de equivalencia = en A (o sea = C Ax A) particiona A en clases 
de equivalencia, de modo que a, a' G A están en la misma clase sii a = a!. Al conjunto de 
las clases de equivalencia, A/ =, se lo llama conjunto cuociente. 

Definición 1.10 Clausurar una relación 1Z C A x A es agregarle la mínima cantidad de 
elementos necesaria para que cumpla una cierta propiedad. 

• Clausura reflexiva: es la menor relación reflexiva que contiene 1Z (“menor” en sentido 
de que no contiene otra, vista como conjunto). Para obtenerla basta incluir todos los 
pares (a, a), a G A, en 7 Z. 

• Clausura transitiva: es la menor relación transitiva que contiene 1Z. Para obtenerla 
deben incluirse todos los pares (a, c) tales que (a, b) ETZ y (b,c) ETZ. Deben considerarse 
también los nuevos pares que se van agregando! 


Definición 1.11 Una función / : A —y B es una relación en Ax B que cumple que Va G 
A, 3! b G B, afb. A ese único b se lo llama /(a). A se llama el dominio y {/(a), a G A} C B 
la imagen de f. 

Definición 1.12 Una función f : A —y B es: 

• inyectiva si a a! /(a) f(a'). 

• sobreyectiva si Vfe G B, 3a G A, f(a ) = b. 

• biyectiva si es inyectiva y sobreyectiva. 


1.3 Cardinalidad 

La cardinalidad de un conjunto finito es simplemente la cantidad de elementos que tiene. 
Esto es más complejo para conjuntos infinitos. Deben darse nombres especiales a estas 
cardinalidades, y no todas las cardinalidades infinitas son iguales. 

Definición 1.13 La cardinalidad de un conjunto A se escribe |A|. Si A es finito, entonces 
|A| es un número natural igual a la cantidad de elementos que pertenecen a A. 

Definición 1.14 

Se dice que |A| < \B\ si existe una función f : A —y B inyectiva. 

Se dice que |A| > \B\ si existe una función f : A —y B sobreyectiva. 

Se dice que |A| = \B\ si existe una función f : A —y B biyectiva. 

Se dice |áL| < \B\ si |ál| < \B\ y no vale |A| = \B\; similarmente con |A| > \B\. 
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Definición 1.15 A la cardinalidad de N se la llama |N| = K 0 (alef sub cero). A todo 
conjunto de cardinal < K 0 se le dice numerable. 

Observación 1.1 Un conjunto numerable A, por definición, admite una sobreyección f : 
N —* A, o lo que es lo mismo, es posible listar los elementos de A en orden /(O), /(1), 
/( 2), ... de manera que todo elemento de A se mencione alguna vez. De modo que para 
demostrar que A es numerable basta exhibir una forma de listar sus elementos y mostrar que 
todo elemento será listado en algún momento. 

Teorema 1.1 K 0 es el menor cardinal infinito. Más precisamente, todo A tal que |H| < K 0 
cumple que |H| es finito o |H| = K 0 . 

Prueba: Si A es infinito, entonces \A\ > n para cualquier n > 0. Es decir, podemos definir 

subconjuntos A n c A, \A n \ = n, para cada n > 0, de modo que \ C A n . Sea a n el único 
elemento de A n — A n _¡. Entonces todos los a n son distintos y podemos hacer una sobreyección de 
{ai, a 2 ,...} en N. □ 

Observación 1.2 El que A C B no implica que |H| < \B\ en conjuntos infinitos. Por 
ejemplo el conjunto de los pares es del mismo cardinal que el de los naturales, mediante la 
biyección f(n) = 2 n. 

Teorema 1.2 El cardinal de ¡p(N) es estrictamente mayor que el de N. 

Prueba: Es fácil ver, mediante biyecciones, que los siguientes conjuntos tienen el mismo cardinal 
que p(N): 

1. Las secuencias infinitas de bits, haciendo la biyección con p(N) dada por: el i-ésimo bit es 1 
sii i — 1 pertenece al subconjunto. 

2. Las funciones / : N —» {0,1}, haciendo la biyección con el punto 1; F(f ) = /(0)/(l)/(2)... 
es una secuencia infinita de bits que describe unívocamente a /. 

3. Los números reales 0 < x < 1: basta escribirlos en binario de la forma 0.01101..., para tener 
la biyección con las secuencias infinitas de bits. Hay algunas sutilezas debido a que 0.0011111... = 
0.0100000 ..,, pero pueden remediarse. 

4. Los reales mismos, M, mediante alguna función biyectiva con [0,1) (punto 3). Hay varias 
funciones trigonométricas, como la tangente, que sirven fácilmente a este propósito. 

Utilizaremos el método de diagonalización de Cantor para demostrar que las secuencias infinitas 
de bits no son numerables. Supondremos, por contradicción, que podemos hacer una lista de todas 
las secuencias de bits, B\, H 2 , B%, ..., donde es la i-ésima secuencia y B,j(j) es el j-ésimo bit 
de Bi. Definamos ahora la secuencia de bits X = -Bi(l) H 2 (2) ..., donde 0 = 1 y 1 = 0. Como 
X(i) = Bi(i ) A se deduce que X A B¿ para todo Bi. Entonces X es una secuencia de bits 

que no aparece en la lista. Para cualquier listado, podemos generar un elemento que no aparece, 
por lo cual no puede existir un listado exhaustivo de todas las secuencias infinitas de bits. □ 
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Observación 1.3 La hipótesis del continuo establece que no existe ningún conjunto X tal 
que |N| < |X| < |R|. Se ha probado que esta hipótesis no se puede probar ni refutar con 
los axiomas usuales de la teoría de conjuntos, sino que es necesario introducirla (o a su 
negación) como un axioma adicional. 

Lema 1.2 Sean A y B numerables. Los siguientes conjuntos son numerables: 

1. AUB. 

2. A x B. 

3. A k , donde A 1 = A y A k = A x A k ~ r . 

4- (J Ai, donde todos los A ¿ son numerables. 

5. A + = A 1 U A 2 U A 3 U ... 

Prueba: Sean ai, 02 ,-.. y 6 i, 62 ,... listados que mencionan todos los elementos de A y B, 

respectivamente. 

1. ai, b\ , a 2 , 62 , • • • lista A U B y todo elemento aparece en la lista alguna vez. Si A n B ^ 0 
esta lista puede tener repeticiones, pero eso está permitido. 

2. No podemos listar (ai, bi), ( 01 , 62 ), (« 1 , 63 ), ... porque por ejemplo nunca llegaríamos a 
listar ( 02 , 61 ). Debemos aplicar un recorrido sobre la matriz de índices de modo que a toda 
celda (aj, 6 j) le llegue su turno. Por ejemplo, por diagonales (i + j creciente): (ai, 61 ), luego 
( 02 , 61 ), (ai, 62 ), luego ( 03 , 61 ), ( 02 , 62 ), (ai, 63 ), y así sucesivamente. 

3. Por inducción sobre k y usando el punto 2. 

4. Sea a t (j ) el j-ésimo elemento de la lista que numera A.¿. Nuevamente se trata de recorrer 
una matriz para que le llegue el turno a todo a¿(j), y se resuelve como el punto 2 . 

5. Es una unión de una cantidad numerable de conjuntos, donde cada uno de ellos es numerable 
por el punto 3, de modo que se puede aplicar el punto 4. Si esto parece demasiado esotérico, 
podemos expresar la solución concretamente: listemos el elemento 1 de A 1 ; luego el 2 de A 1 
y el 1 de A 2 ; luego el 3 de A 1 , el 2 de A 2 y el 1 de A 3 ; etc. Está claro que a cada elemento 
de cada conjunto le llegará su turno. 


□ 

Observación 1.4 El último punto del Lema 1.2 se refiere al conjunto de todas las secuencias 
finitas donde los elementos pertenecen a un conjunto numerable. Si esto es numerable, 
está claro que las secuencias finitas de elementos de un conjunto finito también lo son. 
Curiosamente, las secuencias infinitas no son numerables, ni siquiera sobre conjuntos finitos, 
como se vió para el caso de bits en el Teo. 1.2. 
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Notablemente, aún sin haber visto casi nada de computabilidad, podemos establecer un 
resultado que nos plantea un desafío para el resto del curso: 

Teorema 1.3 Dado cualquier lenguaje de programación, existen funciones de los enteros 
que no se pueden calcular con ningún programa escrito en ese lenguaje. 

Prueba: Incluso restringiéndonos a las funciones que dado un entero deben responder “sí” o 

“no” (por ejemplo, ¿es n primo?), hay una cantidad no numerable de funciones / : N —> {0,1}. 
Todos los programas que se pueden escribir en su lenguaje de programación favorito, en cambio, son 
secuencias finitas de símbolos (ASCII, por ejemplo). Por lo tanto hay sólo una cantidad numerable 
de programas posibles. □ 

Mucho más difícil será exhibir una función que no se pueda calcular, pero es interesante 
que la inmensa mayoría efectivamente no se puede calcular. En realidad esto es un hecho más 
básico aún, por ejemplo la inmensa mayoría de los números reales no puede escribirse en ningún formalismo 
que consista de secuencias de símbolos sobre un alfabeto numerable. 


1.4 Alfabetos, Cadenas y Lenguajes 

En esta sección introducimos notación más específica del curso. Comezaremos por definir lo 
que es un alfabeto. 

Definición 1.16 Llamaremos alfabeto a cualquier conjunto finito no vacío. Usualmente lo 
denotaremos como E. Los elementos de E se llamarán símbolos o caracteres. 

Si bien normalmente usaremos alfabetos intuitivos como {0,1}, {a, b}, {a ... z}, {0 ... 9}, 
etc., algunas veces usaremos conjuntos más sofisticados como alfabetos. 

Definición 1.17 Llamaremos cadena a una secuencia finita de símbolos de un alfabeto E, 
es decir, a un elemento de 


E* = E° U E 1 U E 2 U ... 

donde E 1 = E y E fc = E x E fe-1 . E* denota, entonces, el conjunto de todas las secuencias 
finitas de símbolos de E. El conjunto E° es especial, tiene un sólo elemento llamado e, que 
corresponde a la cadena vacía. Si una cadena x G E fc entonces decimos que su largo es 
M — k (por ello |e| = 0). Otro conjunto que usaremos es E + = E* — {e}. 

Observación 1.5 Es fácil confundir entre una cadena de largo 1, x = (a), y un carácter a. 
Normalmente nos permitiremos identificar ambas cosas. 
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Definición 1.18 Una cadena x sobre E se escribirá yuxtaponiendo sus caracteres uno 
luego del otro, es decir (ai, a 2 ,..., a\ x \), G E, se escribirá como x = a 1 a 2 ...a| x |. 
La concatenación de dos cadenas x = aia 2 .. .a n e y = bib 2 ... b m , se escribe 
xy = a\a 2 .. .a n bib 2 .. .b m , \xy\ = |x| + \y\. Finalmente usaremos x k para denotar k 
concatenaciones sucesivas de x, es decir x° = £ y x k = xx k ~ l . 

Definición 1.19 Dadas cadenas x, y, z, diremos que x es un prefijo de xy, un sufijo de yx, 
y una subcadena o substring de yxz. 

Definición 1.20 Un lenguaje sobre un alfabeto E es cualquier subconjunto de E*. 

Observación 1.6 El conjunto de todas las cadenas sobre cualquier alfabeto es numerable, 
|E*| = y por lo tanto todo lenguaje sobre un alfabeto finito (e incluso numerable) E 
es numerable. Sin embargo, la cantidad de lenguajes distintos es no numerable, pues es 
|P(E*)| > N„. 

Cualquier operación sobre conjuntos puede realizarse sobre lenguajes también. Definamos 
ahora algunas operaciones específicas sobre lenguajes. 

Definición 1.21 Algunas operaciones aplicables a lenguajes sobre un alfabeto E son: 

1. Concatenación: Li o L 2 = {xy, x G Iq, y G L 2 }. 

2. Potencia: L° = {e}, L k = L o L fc_1 . 

3. Clausura de Kleene: L* = (J k> 0 L k . 

4. Complemento: L c = E* — L. 

1.5 Especificación Finita de Lenguajes 

Si un lenguaje L es finito, se puede especificar por extensión, como L 1 = {aba, bbbbb, aa}. 
Si es infinito, se puede especificar mediante predicados, por ejemplo L 2 = {a p , p es primo}. 
Este mecanismo es poderoso, pero no permite tener una idea de 1a, complejidad del lenguaje, 
en el sentido de cuán difícil es determinar si una cadena pertenece o no a L, o de enumerar 
las cadenas de L. Con L\ esto es trivial, y con L 2 perfectamente factible. Pero ahora 
consideremos L 3 = { a n , n > 0, 3x,y,z G N — {0}, x n + y n = z n }. L% está correctamente 
especificado, pero ¿aaa G L{1 Recién con la demostración del último Teorema de Fermat 
en 1995 (luego de más de 3 siglos de esfuerzos), se puede establecer que L 3 = {a,aa}. 
Similarmente, se puede especificar L 4 = {w, w es un teorema de 1a, teoría de números}, y 
responder si w G L 4 equivale a demostrar un teorema. 

El tema central de este curso se puede ver como 1a, búsqueda de descripciones finitas 
para lenguajes infinitos, de modo que sea posible determinar mecánicamente si una cadena 
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está en el lenguaje. ¿Qué interés tiene esto? No es difícil identificar lenguajes con problemas 
de decisión. Por ejemplo, la pregunta ¿el grafo G es bipartito? se puede traducir a una 
pregunta de tipo ¿w e L?, donde L es el conjunto de cadenas que representan los gratos 
bipartitos (representados como una secuencia de alguna manera, ¡finalmente todo son secuencias de bits 
en el computador !), ywes la representación de G. Determinar que ciertos lenguajes no pueden 
decidirse mecánicamente equivale a determinar que ciertos problemas no pueden resolverse 
por computador. 

El siguiente teorema, nuevamente, nos dice que la mayoría de los lenguajes no puede 
decidirse, en el sentido de poder decir si una cadena dada le pertenece o no. Nuevamente, 
es un desafío encontrar un ejemplo. 

Teorema 1.4 Dado cualquier lenguaje de programación, existen lenguajes que no pueden 
decidirse con ningún programa. 

Prueba: Nuevamente, la cantidad de lenguajes es no numerable y la de programas que se pueden 
escribir es numerable. □ 

En el curso veremos mecanismos progresivamente más potentes para describir lenguajes 
cada vez más sofisticados y encontraremos los límites de lo que puede resolverse por 
computador. Varias de las cosas que veremos en el camino tienen además muchas aplicaciones 
prácticas. 



Capítulo 2 

Lenguajes Regulares 


[LP81, sec 1.9 y cap 2] 

En este capítulo estudiaremos una forma particularmente popular de representación 
finita de lenguajes. Los lenguajes regulares son interesantes por su simplicidad, la que 
permite manipularlos fácilmente, y a la vez porque incluyen muchos lenguajes relevantes en 
la práctica. Los mecanismos de búsqueda provistos por varios editores de texto (vi, emacs), 
así como por el shcll de Unix y todas las herramientas asociadas para procesamiento de texto 
(sed, awk, perl), se basan en lenguajes regulares. Los lenguajes regulares también se usan 
en biología computacional para búsqueda en secuencias de ADN o proteínas (por ejemplo 
patrones PROSITE). 

Los lenguajes regulares se pueden describir usando tres mecanismos distintos: expresiones 
regulares (ERs), autómatas finitos determinísticos (AFDs) y no detcrminísticos (AFNDs). 
Algunos de los mecanismos son buenos para describir lenguajes, y otros para implementar 
reconocedores eficientes. 


2.1 Expresiones Regulares (ERs) [lpsi, sec 1 . 9 ] 

Definición 2.1 Una expresión regular (ER) sobre un alfabeto finito E se define 
recursivamente como sigue: 

1. Para todo c G E, c es una ER. 

2. <f> es una ER. 

3. Si Ei y E 2 son ERs, E\ \ E 2 es una ER. 

4- Si Ei y E 2 son ERs, E { ■ E 2 es una ER. 

5. Si Ei es una ER, E x * es una ER. 

6. Si Ei es una ER, ( Ei ) es una ER. 
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Cuando se lee una expresión regular, hay que saber qué operador debe leerse primero. 
Esto se llama precedencia. Por ejemplo, la expresión a \ b ■ c *, ¿debe entenderse como (1) 
la aplicada al resto? (2) ¿la “|” aplicada al resto? (3) ¿la aplicada al resto? La 
respuesta es que, primero que nada se aplican los segundo los y finalmente los 
Esto se expresa diciendo que el orden de precedencia es *, •, |. Los paréntesis sirven para 
alterar la precedencia. Por ejemplo, la expresión anterior, dado el orden de precedencia que 
establecimos, es equivalente a o | (b ■ (c*)). Se puede forzar otro orden de lectura de la ER 
cambiando los paréntesis, por ejemplo (a | b) ■ c*. 

Asimismo, debe aclararse cómo se lee algo como a\b\c, es decir ¿cuál de los dos “|” se 
lee primero? Convengamos que en ambos operadores binarios se lee primero el de más a la 
izquierda (se dice que el operador “asocia a la izquierda”), pero realmente no es importante, 
por razones que veremos enseguida. 

Observar que aún no hemos dicho qué significa una ER, sólo hemos dado su sintaxis pero 
no su semántica. De esto nos encargamos a continuación. 

Definición 2.2 El lenguaje descrito por una ER E, £(£), se define recursivamente como 
sigue: 

1. Si C G E, £(c) = {c}. Esto es un conjunto de una sola cadena de una sola letra. 

2 . £($) = 0 . 

3. C(E 1 | E 2 ) = C{E i) U £(£ 2 ). 

I C{E 1 -E 2 ) = C{Ef) o C(E 2 ). 

5. £( E i*) = £(£i)*. 

6. £((£0) = C(Ei). 

Notar que C(a-b-c-d) = {abed}, por lo cual es común ignorar el símbolo y simplemente 
yuxtaponer los símbolos uno después del otro. Notar también que, dado que “|” y se 
mapean a operadores asociativos, no es relevante si asocian a izquierda o a derecha. 

Observación 2.1 Por definición de clausura de Kleene, £(<!>★) = {e}. Por ello, a pesar de 
no estar formalmente en la definición, permitiremos escribir e como una expresión regular. 

Definición 2.3 Un lenguaje L es regular si existe una ER E tal que L = £(£). 

Ejemplo 2.1 ¿Cómo se podría escribir una ER para las cadenas de a’s y b's que contuvieran una 
cantidad impar de b's? Una solución es a* ( ba-kba *) *6a*, donde lo más importante es la clausura 
de Kleene mayor, que encierra secuencias donde nos aseguramos que las b's vienen de a pares, 
separadas por cuantas a’s se quieran. La primera clausura (a*) permite que la secuencia empiece 
con a’s y la última agrega la b que hace que el total sea impar y además permite que haya a’s al 
final. Es un buen ejercicio jugar con otras soluciones y comentarlas, por ejemplo (a* ba * 6a*) * 6a*. 
Es fácil ver cómo generalizar este ejemplo para que la cantidad de b's módulo k sea r. 
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Algo importante en el Ej. 2.1 es cómo asegurarnos de que la ER realmente representa 
el lenguaje L que creemos. La técnica para esto tiene dos partes: ( i ) ver que toda cadena 
generada está en L; (n) ver que toda cadena de L se puede generar con la ER. En el Ej. 2.1 eso 
podría hacerse de la siguiente manera: Para ( i ) basta ver que la clausura de Kleene introduce 
las 6’s de a dos, de modo que toda cadena generada por la ER tendrá una cantidad impar 
de 6’s. Para (ii), se debe tomar una cadena cualquiera x con una cantidad impar de 6 ’s y 
ver que la ER puede generarla. Esto no es difícil si consideramos las sub cadenas de x que 
van desde una b impar (lera, 3era, ...) hasta la siguiente, y mostramos que cada una de esas 
subcadenas se pueden generar con ba * ba-k. El resto es sencillo. Un ejemplo un poco más 
complicado es el siguiente. 

Ejemplo 2.2 ¿Cómo se podría escribir una ER para las cadenas de a’s y 6 ’s que nunca contuvieran 
tres 6 ’s seguidas? Una solución parece ser (a \ ba \ bba )*, pero ¿está correcta? Si se analiza 
rigurosamente, se notará que esta ER no permite que las cadenas terminen con b, por lo cual 
deberemos corregirla a (a \ ba \ bba ) * (s\b\bb). 

Ejemplo 2.3 ¿Cómo se describiría el lenguaje denotado por la expresión regular (ab \ aba)rí Son 
las cadenas que se pueden descomponer en secuencias ab o aba. Describir con palabras el lenguaje 
denotado por una ER es un arte. En el Ej. 2.1, que empieza con una bonita descripción concisa, 
uno podría caer en una descripción larga y mecánica de lo que significa la ER, como “primero 
viene una secuencia de a’s; después, varias veces, viene una b y una secuencia de a’s, dos veces; 
después...”. En general una descripción más concisa es mejor. 

Ejemplo 2.4 ¿Se podría escribir una ER que denotara los números decimales que son múltiplos 
de 7? (es decir 7, 14, 21 , ...) Sí, pero intentarlo directamente es una empresa temeraria. Veremos 
más adelante cómo lograrlo. 

Observación 2.2 Debería ser evidente que no todos los lenguajes que se me ocurran pueden 
ser descritos con ERs, pues la cantidad de lenguajes distintos sobre un alfabeto finito es no 
numerable, mientras que la cantidad de ERs es numerable. Otra cosa es encontrar lenguajes 
concretos no expresables con ERs y poder demostrar que no lo son. 

Ejemplo 2.5 ¿Se podría escribir una ER que denotara las cadenas de a’s cuyo largo es un número 
primo? No, no se puede. Veremos más adelante cómo demostrar que no se puede. 

Ejemplo 2.6 Algunas aplicaciones prácticas donde se usan ERs es en la especificación de fechas, 
direcciones IP, tags XML, nombres de variables en Java, números en notación flotante, direcciones 
de email, etc. Son ejercicios interesantes, aunque algunos son algo tediosos. 


2.2 Autómatas Finitos Determinísticos (AFDs) 

[LP81, sec 2.1] 

Un AFD es otro mecanismo para describir lenguajes. En vez de pensar en generar las 
cadenas (como las ERs), un AFD describe un lenguaje mediante reconocer las cadenas del 
lenguaje, y ninguna otra. El siguiente ejemplo ilustra un AFD. 
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Ejemplo 2.7 El AFD que reconoce el mismo lenguaje del Ej. 2.1 se puede graficar de la siguiente 
forma. 



El AFD que hemos dibujado se interpreta de la siguiente manera. Los nodos del grato son 
estados. El apuntado con un ángulo ) es el estado inicial , en el que empieza la computación. 
Estando en un estado, el AFD lee una letra de la entrada y, según indique la flecha (llamada 
transición ), pasa a otro estado (siempre debe haber exactamente una flecha saliendo de cada 
estado por cada letra). Cuando se lee toda la cadena, el AFD la acepta o no según el estado 
al que haya llegado sea final o no. Los estados finales se dibujan con doble círculo. 

En este AFD pasa algo que, más o menos explícitamente, siempre ocurre. Cada estado 
se puede asociar a un invariante , es decir, una afirmación sobre la cadena leída hasta ese 
momento. En nuestro caso el estado inicial corresponde al invariante “se ha visto una 
cantidad par de 6’s hasta ahora”, mientras que el estado final corresponde a “se ha visto una 
cantidad impar de 6’s hasta ahora”. 

El siguiente ejemplo muestra la utilidad de esta visión. La correctitud de un AFD con 
respecto a un cierto lenguaje L que se pretende representar se puede demostrar a partir de 
establecer los invariantes, ver que los estados finales, unidos (pues puede haber más de uno), 
describen L, y que las flechas pasan correctamente de un invariante a otro. 

Ejemplo 2.8 El AFD que reconoce el mismo lenguaje del Ej. 2.2 se puede graficar de la siguiente 
forma. Es un buen ejercicio describir el invariante que le corresponde a cada estado. Se ve además 
que puede haber varios estados finales. El estado 3 se llama sumidero , porque una vez caído en él, 
el AFD no puede salir y no puede aceptar la cadena. 



Es hora de definir formalmente lo que es un AFD. 
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Definición 2.4 Un autómata finito determinístico (AFD) es una tupia M = (K, E, ó, s, F), 
tal que 

• K es un conjunto finito de estados. 

• E es un alfabeto finito. 

• s G K es el estado inicial. 

• F C K son los estados finales. 

• 5 : K x E — y K es la función de transición. 

Ejemplo 2.9 El AFD del Ej. 2.7 se describe formalmente como M = (K,T,,S,s,F), donde K = 
{0,1}, E = {a, b}, s = 0, F = {1}, y la función ó como sigue: 


5 

0 

1 

a 

0 

1 

b 

1 

0 


No hemos descrito aún formalmente cómo funciona un AFD. Para ello necesitamos la 
noción de configuración, que contiene la información necesaria para completar el cómputo 
de un AFD. 

Definición 2.5 Una configuración de un AFD M = (. K, E, 5, s, F) es un elemento de Cm = 
K x E*. 

La idea es que la configuración (q, x) indica que M está en el estado q y le falta leer la 
cadena x de la entrada. Esta es información suficiente para predecir lo que ocurrirá en el 
futuro. Lo siguiente es describir cómo el AFD nos lleva de una configuración a la siguiente. 

Definición 2.6 La relación lleva en un paso, h^-C CmxCm se define de la siguiente manera: 
( q,ax ) \~m (q',x), donde a G E, sii S(q,a ) = q'. 

Escribiremos simplemente h en vez de \~ M cuando quede claro de qué M estamos 
hablando. 

Definición 2.7 La relación lleva en cero o más pasos \~* M es la clausura reflexiva y transitiva 
de P M ■ 

Ya estamos en condiciones de definir el lenguaje aceptado por un AFD. La idea es que si 
el AFD es llevado del estado inicial a uno final por la cadena x , entonces la reconoce. 
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Definición 2.8 El lenguaje aceptado por un AFD M = (K, E, 5, s, F ) se define como 


£(M) = {rreE*, 3 feF, (s,x) \-* M (/,£)}. 


Ejemplo 2.10 Tomemos el AFD del Ej. 2.8, el que se describe formalmente como M = 
(. K,Y],5,s,F ), donde K = {0,1,2,3}, E = {a, b}, s = 0, F = {0,1,2}, y la función ó como 
sigue: 


8 

0 

1 

2 

3 

a 

0 

0 

0 

3 

b 

1 

2 

3 

3 


Ahora consideremos la cadena de entrada x = abbababb y escribamos las configuraciones por 
las que pasa M al recibir x como entrada: 


(0, abbababb) b (0 ,bbababb) b (1 ,bababb) b (2 ,ababb) 
b (0, babb) b (1 ,abb) b (0,66) b (1,6) b (2,e). 


Por lo tanto (s,x) b* (2, e), y como 2 € F, tenemos que x € C(M). 


Vamos al desafío del Ej. 2.4, el cual resolveremos con un AFD. La visión de invariantes 
es especialmente útil en este caso. 


Ejemplo 2.11 El AFD que reconoce el mismo lenguaje del Ej. 2.4 se puede graficar de la siguiente 
forma. Para no enredar el gráfico de más, sólo se incluyen las flechas que salen de los estados 0, 1 
y 2. 
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El razonamiento es el siguiente. Cada estado representa el resto del número leído hasta ahora, 
módulo 7. El estado inicial (y final) representa el cero. Si estoy en el estado 2 y viene un 4, 
significa que el número que leí hasta ahora era n = 2 (morí 7) y ahora el nuevo número leído es 
10-ra + 4 = 10-2 + 4 = 24 = 3 (morí 7). Por ello se pasa al estado 3. El lector puede completar 
las flechas que faltan en el diagrama. 

Hemos resuelto usando AFDs un problema que es bastante más complicado usando 
ERs. El siguiente ejemplo ilustra el caso contrario: el Ej. 2.3, sumamente fácil con ERs, 
es relativamente complejo con AFDs, y de hecho no es fácil convencerse de su correctitud. 
El principal problema es, cuando se ha leído ab, determinar si una a que sigue inicia una 
nueva cadena (pues hemos leído la cadena ab) o es el último carácter de aba. 

Ejemplo 2.12 El lenguaje descrito en el Ej. 2.3 se puede reconocer con el siguiente AFD. 
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2.3 Autómatas Finitos No Determinísticos (AFNDs) 

[LP81, sec 2.2] 

Dado el estado actual y el siguiente carácter, el AFD pasa exactamente a un siguiente 
estado. Por eso se lo llama detcrminístico. Una versión en principio más potente es un 
AFND, donde frente a un estado actual y un siguiente carácter, es posible tener cero, uno o 
más estados siguientes. 

Hay dos formas posibles de entender cómo funciona un AFND. La primera es pensar 
que, cuando hay varias alternativas, el AFND elige alguna de ellas. Si existe una forma de 
elegir el siguiente estado que me lleve finalmente a aceptar la cadena, entonces el AFND la 
aceptará. La segunda forma es imaginarse que el AFND está en varios estados a la vez (en 
todos en los que “puede estar” de acuerdo a la primera visión). Si luego de leer la cadena 
puede estar en un estado final, acepta la cadena. En cualquier caso, es bueno por un rato 
no pensar en cómo implcmentar un AFND. 

Una libertad adicional que permitiremos en los AFNDs es la de rotular las transiciones 
con cadenas, no sólo con caracteres. Tal transición se puede seguir cuando los caracteres de 
la entrada calzan con la cadena que rotula la transición, consumiendo los caracteres de la 
entrada. Un caso particularmente relevante es el de las llamadas transiciones-e , rotuladas 
por la cadena vacía. Una transición-e de un estado p a uno q permite activar q siempre que 
se active p, sin necesidad de leer ningún carácter de la entrada. 

Ejemplo 2.13 Según la descripción, es muy fácil definir un AFND que acepte el lenguaje del 
Ej. 2.3. Se presentan varias alternativas, donde en la (2) y la (3) se hace uso de cadenas rotulando 
transiciones. 



El Ej. 2.13 ilustra en el AFND (3) un punto interesante. Este AFND tiene sólo un estado 
y éste es final. ¿Cómo puede no aceptar una cadena? Supongamos que recibe como entrada 
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bb. Parte del estado inicial (y final), y no tiene transiciones para moverse. Queda, pues, 
en ese estado. ¿Acepta la cadena? No, pues no ha logrado consumirla. Un AFND acepta 
una cadena cuando tiene una forma de consumirla y llegar a un estado final. Es hora de 
formalizar. 

Definición 2.9 Un autómata finito no determinístico (AFND) es una tupia M = 
(. K , E, A, s, F ), tal que 

• K es un conjunto finito de estados. 

• E es un alfabeto finito. 

• s G K es el estado inicial. 

• F C K son los estados finales. 

• A Cf K x E* x K es la relación de transición, finita. 

Ejemplo 2.14 El AFND (2) del Ej. 2.13 se describe formalmente como M = (A, E, A, s, F), 
donde K = {0,1,2}, E = {a, 6}, s = 0, F = {0}, y la relación A = 
{(0,o,l), (1,6,2), (2,o,0), (2, e, 0)}. 

Para describir la semántica de un AFND reutilizaremos la noción de configuración 
(Def. 2.5). Redefiniremos la relación \~ M para el caso de AFNDs. 

Definición 2.10 La relación lleva en un paso, P mQ Cm x Cm, donde M = (K, E, A, s, F) 
es un AFND, se define de la siguiente manera: (q,zx) \~m (q',x), donde z G E *, sii 

(q,z,q') G A. 

Nótese que ahora, a partir de una cierta configuración, la relación \~m nos puede llevar 
a varias configuraciones distintas, o incluso a ninguna. La clausura reflexiva y transitiva 
de \~m se llama, nuevamente, lleva en cero o más pasos, \~* M . Finalmente, definimos casi 
idénticamente al caso de AFDs el lenguaje aceptado por un AFND. 

Definición 2.11 El lenguaje aceptado por un AFND M = (K, E, A, s, F) se define como 

C{M) = {.GE*, 3f G F, (s,x) P * M (/,£)}. 


A diferencia del caso de AFDs, dada una cadena x, es posible llegar a varios estados 
distintos (o a ninguno) luego de haberla consumido. La cadena se declara aceptada si alguno 
de los estados a los que se llega es final. 
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Ejemplo 2.15 Consideremos la cadena de entrada x = ababaababa y escribamos las 
configuraciones por las que pasa el AFND (3) del Ej. 2.13 al recibir x como entrada. En un 
primer intento: 


(0, ababaababa ) b (0, abaababa) b (0, aababa) 

no logramos consumir la cadena (por haber “tomado las transiciones incorrectas”). Pero si elegimos 
otras transiciones: 


(0 ,ababaababa) b (0, abaababa) b (0, ababa) b (0,6a) b (0,e). 

Por lo tanto (s,x) b* (0,e), y como 0 € F, tenemos que x € C{M). Esto es válido a pesar de 
que existe otro camino por el que (s,x) b* (0, aababa), de donde no es posible seguir avanzando. 

Terminaremos con una nota acerca de cómo simular un AFND. En las siguientes secciones 
veremos que de hecho los AFNDs pueden convertirse a AFDs, donde es evidente cómo 
simularlos eficientemente. 

Observación 2.3 Un AFND con n estados y m transiciones puede simularse en un 
computador en tiempo 0(n + m) por cada símbolo de la cadena de entrada. Es un 
buen ejercicio pensar cómo (tiene que ver con recorrido de grajos, especialmente por las 
transiciones-e). 

2.4 Conversión de ER a AFND [lpsi, sec 2 . 5 ] 


Como adelantamos, ERs, AFDs y AFNDs son mecanismos equivalentes para denotar los 
lenguajes regulares. En estas tres secciones demostraremos esto mediante convertir ER —y 
AFND —» AFD —> ER. Las dos primeras conversiones son muy relevantes en la práctica, 
pues permiten construir verificadores o buscadores eficientes a partir de ERs. 

Hay distintas formas de convertir una ER E a un AFND M, de modo que C(E) = £(M). 
Veremos el método de Thompson, que es de los más sencillos. 

Definición 2.12 La función Th convierte ERs en AFNDs según las siguientes reglas. 

1. Para c G £, Th(c) = 



2. Th(fb) = 



¡Sí, el grato puede no ser conexo! 
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Prueba: Es fácil verificarlo por inspección y aplicando inducción estructural. La única parte que 
puede causar problemas es la clausura de Kleene, donde otros esquemas alternativos que podrían 
sugerirse (por ejemplo M = (Ai,E,Ai U {(/i, s, s±), (si, s, fi)}, si, {/i}) tienen el problema de 
permitir terminar un recorrido de Th(Ei) antes de tiempo. Por ejemplo el ejemplo que acabamos 
de dar, aplicado sobre E\ = a * b, reconocería la cadena x = aa. □ 

Ejemplo 2.16 Si aplicamos el método de Thompson para convertir la ER del Ej. 2.3 a AFND, 
el resultado es distinto de las tres variantes dadas en el Ej. 2.13. 



2.5 Conversión de AFND a AFD [lpsi, sec 2 . 3 ] 

Si bien los AFNDs tienen en principio más flexibilidad que los AFDs, es posible construir 
siempre un AFD equivalente a un AFND dado. La razón fundamental, y la idea de la 
conversión, es que el conjunto de estados del AFND que pueden estar activos después de 
haber leído una cadena x es una función únicamente de x. Por ello, puede diseñarse un AFD 
basado en los conjuntos de estados del AFND. 

Lo primero que necesitamos es describir, a partir de un estado q del AFND, a qué estados 
q' podemos llegar sin consumir caracteres de la entrada. 

Definición 2.13 Dado un AFND M = (K, E, A, s, F), la clausura-^ de un estado q G K se 
define como 

E(q) = {q'eK,(q,e) \~* M (q',e)}. 


Ya estamos en condiciones de definir la conversión de un AFND a un AFD. Para ello 
supondremos que las transiciones del AFND están rotuladas o bien por £ o bien por una sola 
letra. Es muy fácil adaptar cualquier AFND para que cumpla esto. 

Definición 2.14 Dado un AFND M = (K, E, A, s, F) que cumple (q,x,q') e A =>■ |x| < l, 
se define un AFD det(M) = (. K ', E, S, s', F') de la siguiente manera: 
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1. K' — p(K). Es decir los subconjuntos de K , o conjuntos de estados de M. 

2. s' = E(s). Es decir la clausura-e del estado inicial de M. 

3. F' = K' — p{K — F) . Es decir todos los conjuntos de estados de M que contengan algún estado 
de F. 

4- Para todo Q e K' (o sea QCKjycEF, 

6(Q,c) = 1J £(<,'). 

<?eQ,(g,c,g')e A 

Esta última ecuación es la que preserva la semántica que buscamos para el AFD. 

Ejemplo 2.17 Si calculamos det sobre el AFND del Ej. 2.16 obtenemos el siguiente resultado. 
Observar que se trata del mismo AFD que presentamos en el Ej. 2.12. Lo que era un desafío hacer 
directamente, ahora lo podemos hacer mecánicamente mediante convertir ER —>• AFND —>• AFD. 



En el Ej. 2.17 sólo hemos graficado algunos de los estados de K', más precisamente 
aquellos alcanzables desde el estado inicial. Los demás son irrelevantes. La forma de 
determinizar un AFND en la práctica es calcular s 1 = E(s), luego calcular 5(s',c) para 
cada c € E, y recursivamente calcular las transiciones que salen de estos nuevos estados, 
hasta que todos los estados nuevos producidos sean ya conocidos. De este modo se calculan 
solamente los estados necesarios de K'. 

Observación 2.5 No hay garantía de que el método visto genere el menor AFD que reconoce 
el mismo lenguaje que el AFND. Existen, sin embargo, técnicas para minimizar AFDs, que 
no veremos aquí. 

El siguiente teorema establece la equivalencia entre un AFND y el AFD que se obtiene 
con la técnica expuesta. 
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Teorema 2.2 Sea M un AFND, entonces C(det(M )) = C(M). 

Prueba: Demostraremos que toda cadena reconocida por el AFD M' = det(M) también es 

reconocida por el AFND M , y viceversa. En cada caso, se procede por inducción sobre la longitud 
de la cadena. Lo que se demuestra es algo un poco más fuerte, para que la inducción funcione: (¿) 
si x lleva de s a q en el AFND, entonces lleva de s' = E(s) a algún Q tal que q E Q en el AFD; 
(ii) si x lleva de E(s) a Q en el AFD, entonces lleva de s a cualquier q € Q en el AFND. De esto 
se deduce inmediatamente que x € C(M) x € C(M'). 

Primero demostremos (i) y (ii) para el caso base x = e. Es fácil ver que (e, s) \~* M (e, q) sii 
q € E(s). Por otro lado (e,E(s)) \~* M , (s,Q) sii Q = E(s) pues M' es determinístico. Se deducen 
(¿) y (ii) inmediatamente. 

Veamos ahora el caso inductivo x = ya, a € £, para (i). Si (s, ya) \~* M (■ q , e), como M consume 
las letras de a una, existe un camino de la forma (s,ya) \~* M ( q',a ) \~m (q ", e) S* M (q,e). 

Notar que esto implica que (q',a,q") € A y q G E(q"). Por hipótesis inductiva, además, tenemos 
( E(s),ya) \~* M , (Q',a ) para algún Q' que contiene q' . Ahora bien, ( Q',a) \~m’ (Qu), donde 
Q = 5(Q',a ) incluye, por la Def. 2.14, a E(q"), pues q' € Q' y (q',a,q") € A. Finalmente, como 
q € E(q"), tenemos q G Q y terminamos. 

Veamos ahora el caso inductivo x = ya, a € £, para (ii). Si ( E(s),ya ) h^, (Q,e) 

debemos tener un camino de la forma ( E(s),ya) \~* M , ( Q',a) \~m' (Qt), donde Q = 5(Q',a). 
Por hipótesis inductiva, esto implica (. s , ya) \~* M (q', a) para todo q' € Q'■ Asimismo, 

( q',a ) \~m (q",£) L* m (q,e), para todo (q',a,q") € A, y q G E(q"). De la Def. 2.14 se deduce 
que cualquier q £ Q pertenece a algún E(q") donde (q 1 , a, q") £ Ay q' £ Q'. Hemos visto que M' 
puede llevar a cualquiera de esos estados. □ 

La siguiente observación indica cómo buscar las ocurrencias de una ER en un texto. 

Observación 2.6 Supongamos que queremos buscar las ocurrencias en un texto T de una 
ER E. Si calculamos det(Th(E-k ■ E)), obtenemos un AFD que reconoce cadenas terminadas 
en E. Si alimentamos este AFD con el texto T, llegará al estado final en todas las posiciones 
de T que terminan una ocurrencia de una cadena de E. El algoritmo resultante es muy 
eficiente en términos del largo de T, si bien la conversión de AFND a AFD puede tomar 
tiempo exponencial en el largo de E. 

2.6 Conversión de AFD a ER [lpsi, sec 2 . 5 ] 

Finalmente, cerraremos el triángulo mostrando que los AFDs se pueden convertir a ERs 
que generen el mismo lenguaje. Esta conversión tiene poco interés práctico, pero es esencial 
para mostrar que los tres mecanismos de especificar lenguajes son equivalentes. 

La idea es numerar los estados de K de cero en adelante, y definir ERs de la forma 
R(i, j, k), que denotarán las cadenas que llevan al AFD del estado i al estado j utilizando en el 
camino solamente estados numerados < k. Notar que los caminos pueden ser arbitrariamente 
largos, pues la limitación está dada por los estados intermedios que se pueden usar. Asimismo 
la limitación no vale (obviamente) para los extremos i y j. 
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Definición 2.15 Dado un AFD M = (. K,T.,S,s,F ) con K = {0,1, ..., n — 1} definimos 
expresiones regulares R(i,j,k ) para todo O < i,j < n, O < k < n, inductivamente sobre k 
como sigue. 


1. R(i,j, 0) 


í $ | Ci | c 2 
\ £ | ci | c 2 


Q si {ci, 02 ,..., Ci} = {c G E, 5(i, c)= j} eifi- j 
Ci Si {ci, c 2 ,..., c¡} = {céE, ó(i, c) = j} e i = j 


2. R(i, j, k + 1) = R(i, j, k ) | R(i, k, k ) • R(k, k,k)* ■ R(k, j, k ). 


Notar que el $ se usa para el caso en que 1 = 0. 


En el siguiente lema establecemos que la definición de las R hace lo que esperamos de 

ellas. 


Lema 2.1 R(i,j, k ) es el conjunto de cadenas que reconoce M al pasar del estado i al estado 
j usando como nodos intermedios solamente nodos numerados < k. 

Prueba: Para el caso base, la única forma de ir de i a j es mediante transiciones directas entre 
los nodos, pues no está permitido usar ningún nodo intermedio. Por lo tanto solamente podemos 
reconocer cadenas de un carácter. Si i = j entonces también la cadena vacía nos lleva de i a i. Para 
el caso inductivo, tenemos que ir de i a j pasando por nodos numerados hasta k. Una posibilidad 
es sólo usar nodos < k en el camino, y las cadenas resultantes son R(i,j,k). La otra es usar el 
nodo k una ó más veces. Entre dos pasadas consecutivas por el nodo k, no se pasa por el nodo 
k. De modo que partimos el camino entre: lo que se reconoce antes de llegar a k por primera vez 
(. R(i,k,k )), lo que se reconoce al ir (dando cero ó más vueltas) de k a k (R(k,k,k)*), y lo que se 
reconoce al partir de k por última vez y llegar a j (. R(k,j, k)). □ 

Del Lema 2.1 es bastante evidente lo apropiado de la siguiente definición. Indica que el 
lenguaje reconocido por el AFD es la unión de las R desde el estado inicial hasta los distintos 
estados finales, usando cualquier nodo posible en el camino intermedio. 

Definición 2.16 Sea M = (K,H,8,s,F) con K = {0, 1, ..., n — 1} un AFD, y F = 
{/i, / 2 ,.. ■, fm}- Entonces definimos la ER 

er(M) = R(s,fi,n ) | R(s,f 2 ,n ) | ... | R(s,f m ,n). 


De lo anterior se deduce que es posible generar una ER para cualquier AFD, manteniendo 
el mismo lenguaje. 

Teorema 2.3 Sea M un AFD, entonces C{er{M)) = C{M). 

Prueba: Es evidente a partir del Lema 2.1 y del hecho de que las cadenas que acepta un AFD 
son aquellas que lo llevan del estado inicial a algún estado final, pasando por cualquier estado 
intermedio. □ 
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Ejemplo 2.18 Consideremos el AFD del Ej. 2.7 y generemos er(M). 


er(M ) 

= #(0,1,2) 




^(0,1,2) 

= #( 0 , 1 , 1 ) 

1 #( 0 , 1 , 1 ) 

•#(1,1,1)*' 

•#(1,1,1) 

#(0,1,1) 

= #( 0 , 1 , 0 ) 

1 #(0,0,0) 

• 12(0,0,0) *• 

■#(0,1,0) 

#( 1 , 1 , 1 ) 

= #(1,1,0) 

1 #(1,0,0) 

• 12(0,0,0) *■ 

'#(0,1,0) 

#(0,1,0) 

= b 




12(0,0,0) 

= a \ e 




#(1,1,0) 

= a \ e 




#(1,0,0) 

= b 




#(1,1,1) 

= a \ e \b■ 

(a | e) * • b 




= a e bak b 



#(0,1,1) 

= b (a e) 

■ (a | e) k -l 

') 



= a-k b 




#(0,1,2) 

= a*í) a*b(a £ 

bak b) k ■ (a 

| £ | bak b) 

er(M) 

= a-k b (a 

ba k b)k 




Notar que nos hemos permitido algunas simplificaciones en las ERs antes de utilizarlas para 
R's superiores. El resultado no es el mismo que el que obtuvimos a mano en el Ej. 2.1, y de hecho 
toma algo de tiempo convencerse de que es correcto. 

Como puede verse, no es necesario en la práctica calcular todas las R(i,j,k), sino que 
basta partir de las que solicita er(M) e ir produciendo recursivamente las que se van 
necesitando. 

Por último, habiendo cerrado el triángulo, podemos establecer el siguiente teorema 
fundamental de los lenguajes regulares. 

Teorema 2.4 Todo lenguaje regular puede ser especificado con una ER, o bien con un 
AFND, o bien con un AFD. 

Prueba: Inmediato a partir de los Teos. 2.1, 2.2 y 2.3. □ 

De ahora en adelante, cada vez que se hable de un lenguaje regular, se puede suponer 
que se lo tiene descrito con una ER, AFND o AFD, según resulte más conveniente. 

Ejemplo 2.19 El desafío del Ej. 2.4 ahora es viable en forma mecánica, aplicando er al AFD del 
Ej. 2.11. Toma trabajo pero puede hacerse automáticamente. 


2.7 Propiedades de Clausura [lpsi, sec 2.4 y 2 . 6 ] 

Las propiedades de clausura se refieren a qué operaciones podemos hacer sobre lenguajes 
regulares de modo que el resultado siga siendo un lenguaje regular. Primero demostraremos 
algunas propiedades sencillas de clausura. 
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Lema 2.2 La unión, concatenación y clausura de lenguajes regulares es regular. 

Prueba: Basta considerar ERs E\ y E 2 , de modo que los lenguajes L\ = C(E\) y L 2 = £(£ 2 )- 
Entonces L\ U L 2 = £(£1 \ E 2 ), L\ o L 2 = £(£1 ■ E 2 ) y Ll* = £(£ 1 *) son regulares. □ 

Una pregunta un poco menos evidente se refiere a la complementación e intersección de 
lenguajes regulares. 

Lema 2.3 El complemento de un lenguaje regular es regular , y la intersección y diferencia 
de dos lenguajes regulares es regular. 

Prueba: Para el complemento basta considerar el AFD Al = ( K , E, 5, s , F) que reconoce L , y ver 
que M' = (AT, E, S, s, K — F ) reconoce L c = E* — L. La intersección es inmediata a partir de la 
unión y el complemento, L\ n ¿2 = {L\ U L 2 ) c . La diferencia es L\ — L 2 = L\ n L 2 . □ 

Observación 2.7 Es posible obtener la intersección en forma más directa, considerando un 
AFD con estados K = K x x K 2 . Es un ejercicio interesante imaginar cómo opera este AFD 
y definirlo formalmente. 

Ejemplo 2.20 Es un desafío obtener directamente la ER de la diferencia de dos ERs. Ahora 
tenemos que esto puede hacerse mecánicamente. Es un ejercicio interesante, para apreciar la 
sofisticación obtenida, indicar paso a paso cómo se haría para obtener la ER de L\ — L 2 a partir 
de las ERs de L 1 y L 2 . 

Ejemplo 2.21 Las operaciones sobre lenguajes regulares permiten demostrar que ciertos 
lenguajes son regulares con más herramientas que las provistas por ERs o autómatas. Por ejemplo, 
se puede demostrar que los números decimales correctamente escritos (sin ceros delante) que son 
múltiplos de 7 pero no múltiplos de 11, y que además tienen una cantidad impar de dígitos ‘4’, 
forman un lenguaje regular. Llamando D = 0 | 1 | ... | 9, al AFD del Ej. 2.11, M\\ a uno 
similar para los múltiplos de 11, y L 4 a una ER similar a la del Ej. 2.1 pero que cuenta 4’s, el 
lenguaje que queremos es — £(Mn)) n £(£4)) — C (0 • DE). ¿Se atreve a dar una ER o 

AFND para el resultado? (no es en serio, puede llevarle mucho tiempo). 


2.8 Lema de Bombeo 


[LP81, sec 2.6] 


Hasta ahora hemos visto diversas formas de mostrar que un lenguaje es regular, pero 
ninguna (aparte de que no nos funcione nada de lo que sabemos hacer) para mostrar que no 
lo es. Veremos ahora una herramienta para demostrar qne un cierto L no es regular. 

Observación 2.8 Pregunta capciosa: Esta herramienta que veremos, ¿funciona para 
todos los lenguajes no regulares? ¡Imposible, pues hay más lenguajes no regulares que 
demostraciones! 
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La idea esencial es que un lenguaje regular debe tener cierta repetitividad, producto de 
la capacidad limitada del AFD que lo reconoce. Más precisamente, todo lo que el AFD 
recuerda sobre la cadena ya leída se condensa en su estado actual, para el cual hay sólo una 
cantidad finita de posibilidades. El siguiente teorema (que por alguna razón se llama Lema 
de Bombeo) explota precisamente este hecho, aunque a primera vista no se note, ni tampoco 
se vea cómo usarlo para probar que un lenguaje no es regular. 

Teorema 2.5 (Lema de Bombeo) 

Sea L un lenguaje regular. Entonces existe un número N > 0 tal que toda cadena w E L 
de largo |w| > N se puede escribir como w = xyz de modo que y ^ e, \xy\ < N, y 
Vn > 0, xy n z E L. 

Prueba: Sea M = (A, E, 5, s, F) un AFD que reconoce L. Definiremos N = \K\. Al leer w, 
M pasa por distintas configuraciones hasta llegar a un estado final. Consideremos los primeros N 
caracteres de zu en este camino, llamándole al estado al que se llega luego de consumir w\w 2 ... wp. 

(q 0 ,w iw 2 ...) F (qi,w 2 ...) F...F (<?¿, iu i+1 ...) F...F (qj,w j+ 1 ...) F...F (q N ,w N+ i...) F ... 

Los estados qo, qi, ■ ■ ■, qN no pueden ser todos distintos, pues M tiene sólo N estados. De modo 
que en algún punto del camino se repite algún estado. Digamos q¡ = qj, i < j. Eso significa que, si 
eliminamos y = ... Wj de w, M llegará exactamente al mismo estado final al que llegaba 

antes: 

(q 0 ,w 1 w 2 • • •) F (qi,w 2 ...) F...F (g¿_i, Wi ...) F (g¿ = qj, w j+1 ...) F...F (q N ,w N+ 1 ...) F... 

y, similarmente, podemos duplicar y en w tantas veces como queramos y el resultado será el mismo. 
Llamando x = w\... Wi, y = Wi + \... Wj, y z = Wj + \... w\ w \, tenemos entonces el teorema. Es fácil 
verificar que todas las condiciones valen. □ 

¿Cómo utilizar el Lema de Bombeo para demostrar que un lenguaje no es regular? La 
idea es negar las condiciones del Teo. 2.5. 

1. Para cualquier longitud N, 

2. debemos ser capaces de elegir alguna w E L, |w| > N, 

3. de modo que para cualquier forma de partir w = xyz, y ^ £, \xy\ < N, 

4. podamos encontrar alguna n > 0 tal que xy n z jL L. 

Una buena forma de pensar en este proceso es en que se juega contra un adversario. El 
elige N, nosotros w, él la particiona en xyz, nosotros elegimos n. Si somos capaces de ganarle 
haga lo que haga, hemos demostrado que L no es regular. 

Ejemplo 2.22 Demostremos que L = {a n b n , n > 0} no es regular. Dado N , elegimos w = a N b N . 
Ahora, se elija como se elija y dentro de w, ésta constará de puras a’s, es decir, x = a r , y = a s , 
z = a N ~ r ~ s b N , r+s < N, s > 0. Ahora basta mostrar que xy°z = xz = a r a N ~ r ~ s b N = a N ~ s b N 0 L 
pues s > 0. 
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Un ejemplo que requiere algo más de inspiración es el siguiente. 

Ejemplo 2.23 Demostremos que L = {a p , p es primo} no es regular. Dado N, elegimos un 
primo p > N + 1, w = a p . Ahora, para toda elección x = a r , y = a s , z = a*, r + s +1 = p, debemos 
encontrar algún n > 0 tal que a r+ns+t fL L, es decir, r + ns +1 no es primo. Pero esto siempre es 
posible, basta con elegir n = r + t para tener r + ns + t = (r + 1) (s + 1) compuesto. Ambos factores 
son mayores que 1 porque s>0yr + t = p — s> ( N + 1) — N. 


2.9 Propiedades Algorítmicas de Lenguajes Regulares 

[LP81, sec 2.j] 

Antes de terminar con lenguajes regulares, examinemos algunas propiedades llamadas 
“algorítmicas”, que tienen relación con qué tipo de preguntas pueden hacerse sobre lenguajes 
regulares y responderse en forma mecánica. Si bien a esta altura pueden parecer algo 
esotéricas, estas preguntas adquieren sentido más adelante. 


Lema 2.4 Dados lenguajes regulares L, L\, L- 2 (descritos mediante ERs o autómatas), las 
siguientes preguntas tienen respuesta algorítmica: 


1 . 

2 . 

3. 

I 

5. 


Dada u 

> e E*, 

¿Es 

L = 

= 0? 

¿Es 

L = 

= E* ? 

¿Es 

Lx 

c l 2 ? 

¿Es 

Ex 

= l 2 ? 


Prueba: Para (1) tomamos el AFD que reconoce L y lo alimentamos con w, viendo si llega a 
un estado final o no. ¡Para eso son los AFDs!. Para (2), vemos si en el AFD existe un camino 
del estado inicial a un estado final. Esto se resuelve fácilmente con algoritmos de grajos. Para (3), 
complementamos el AFD de L y reducimos la pregunta a (2). Para (4), calculamos L = L\ — L- 2 
y reducimos la pregunta a (2) con respecto a L. Para (5), reducimos la pregunta a (4), L\ C L 2 y 
L 2 C L 1 . □ 


Observación 2.9 En estas demostraciones hemos utilizado por primera vez el concepto de 
reducción de problemas: se reduce un problema que no se sabe resolver a uno que si se sabe. 
Más adelante usaremos esta idea al revés: reduciremos un problema que sabemos que no se 
puede resolver a uno que queremos demostrar que no se puede resolver. 
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2.10 Ejercicios 

Expresiones Regulares 

1. ¿Qué lenguaje representa la expresión ((a* a) b) \ b ? 

2. Reescriba las siguientes expresiones regulares de una forma más simple 

(a) <£>* | a-k | b-k | (a | £>) ^ 

(b) ((a-k bk)k (b-k a*)*)* 

(c) (ak b ) * | (b-k a)k 

(d) (a | b) -k a(a\b)-k 

3. Sea E = {a,b}. Escriba expresiones regulares para los siguientes conjuntos 

(a) Las cadenas en E* con no más de 3 a’s. 

(b) Las cadenas en E* con una cantidad de a’s divisible por 3. 

(c) Las cadenas en E* con exactamente una ocurrencia de la subcadena aaa. 

4. Pruebe que si L es regular, también lo es L' = {mu, u G E*, w G L}, mediante hallar 
una expresión regular para L'. 

5. ¿Cuáles de las siguientes afirmaciones son verdaderas? Explique. (Abusaremos de la 
notación escribiendo c* para {c}*). 

(a) baa G a*b*a*b* 

(b) b*a* n a*b* = a* U b* 

(c) a*b* n c*d* = 0 

(d) abed G (a(cd)*b)* 

AFDs, AFNDs y Conversiones 

1. Dibuje los siguientes AFDs y describa informalmente el lenguaje que aceptan. Hemos 
escrito la función ó como un conjunto. 

(a) K = {q 0 , qi, q 2 , q 3 }, E = {a,b}, s = q 0 ,F = {q>i}, 

á = {(q 0 , a, gi), (q 0 , b, q 2 ), (qi, a, q 3 ), (q u b, q 0 ), (q 2 , a, q 2 ), (q 2 , b, q 2 ), (q 3 , a, q 2 ), (q 3 , b, q 2 )}. 

(b) K = {q 0 , q\, q 2 , <H}, S = {a, b}, s = q 0 ,F = {q 2 , q 3 }, 

5 = {(q 0 , a, qi), (q 0 , b, q 3 ), (q 1 , a, q x ), (q u b, q 2 ), (q 2 , a, q A ), (q 2 , b, q A ), (q 3 , a, q A ), (q 3 , b, q A ), 

(? 4 , a, q A ), (q A ,b,q A )}. 
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(c) K = {q 0 , q u q 2 , q 3 }, £ = {a,b}, s = q 0 , F = {q 0 }, 

S = {{q 0 ,a,q i), ( q 0 ,b,q 3 ), (q 1 ,a,q 2 ), (qi,b,q 0 ), (q 2 ,a,q 3 ), (q 2 ,b,q i), (q 3 ,a,q 3 ), (q 3 ,b,q 3 )j. 

(d) Idem al anterior pero s = q±, F = {qi}. 

2. Construya AFDs que acepten cada uno de los siguientes lenguajes. Escríbalos 
formalmente y dibújelos. 

(a) {te G {a, b}*, cada a en w está precedido y seguido por una b} 

(b) {te G {a, b}*, w tiene abab como subcadena} 

(c) {w G (a, b}*, w no tiene aa ni bb como subcadena} 

(d) (te G (a, b}*, w tiene una cantidad impar de a’s y una cantidad par de 6’s}. 

(e) {w G (a, b}*, w tiene ab y ba como subcadenas}. 

3. ¿Cuáles de las siguientes cadenas son aceptadas por los siguientes autómatas? 


(a) aa, aba, abb, ab, abab. 





£ 

4. Dibuje AFNDs que acepten los siguientes lenguajes. Luego conviértalos a AFDs. 

(a) (ab)*(ba)* U aa* 

(b) ((ab U aab)*a*)* 

(c) ((a*b*a*)*b)* 

(d) (ba U b)* U (bb U a)* 


5. Escriba expresiones regulares para los lenguajes aceptados por los siguientes AFNDs. 
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(a) K = (g 0 , qi}, E = {a, b}, s = q 0 , F = {g 0 }, 

A = {(g 0 , ab, g 0 ), (g 0 , a, g 4 ), (g 4 , bb, gi)} 

(b) K = {q 0 , qi, g 2 , gs}, S = {a, 6}, s = q 0 ,F = {g 0 , q 2 }, 

A = {(g 0 , a, gi), (gi, b, g 2 ), (g 2 , a, gi), (gi, 6, g 3 ), (g 3 , a, g 2 )} 

(c) Jí = {g 0 , gi, g 2 , g 3 , g 4 , g 5 }, S = {a, 6}, s = q 0 ,F = {q 1 , g 5 }, 

A = {(g 0 , e, gi), (g 0 , a, g 4 ), (gi, a, g 2 ), (g 2 , a, g 3 ), (g 3 , a, g 4 ), (g 4 , a, g 5 ), (g 5 , a, g 4 )} 

6. (a) Encuentre un AFND simple para (aa | aab \ aba)*. 

(b) Conviértalo en un autómata determinístico usando el algoritmo visto. 

(c) Trate de entender el funcionamiento del autómata. ¿Puede hallar uno con menos 
estados que reconozca el mismo lenguaje? 

(d) Repita los mismos pasos para (a | b) * aabab. 

Propiedades de Clausura y Algorítmicas 

1. Pruebe que si L es regular, entonces los siguientes conjuntos también lo son 

(a) Pref(L) = {x, By, xy e L} 

(b) Suf(L) = {y, 3x, xy G L} 

(c) Subs(L) = {y, 3 x,z, xyz G L} 

(d) Max(L) = {w <E L, x e =>■ wx L} 

(e) L R = {w R , w G L} (■ w R es w leído al revés). 

2. Muestre que hay algoritmos para responder las siguientes preguntas, donde L\ y L 2 
son lenguajes regulares 

(a) No hay una sola cadena w en común entre L\ y L 2 . 

(b) L\ y L 2 son uno el complemento del otro 

(c) L\ = L 2 

(d) L\ = Pref (L 2 ) 

Lenguajes Regulares y No Regulares 

1. Demuestre que cada uno de los siguientes conjuntos es o no es regular. 

(a) {a 10 ", n > 0} 

(b) {w G {0..9}*, w representa 10" para algún n > 0} 
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(c) {w G {0..9}*, w es una secuencia de dígitos que aparece en la expansión decimal 
de 1/7 = 0.142857 142857 142857...} 

2. Demuestre que el conjunto {a n ba m ba n+m , n, rn > 0} no es regular. Visto 

operacionalmente, esto implica que los autómatas finitos no saben “sumar”. 

3. Pruebe que los siguientes conjuntos no son regulares. 

(a) {ww R , w G {a, b}*} 

(b) {ww, w G (a, b}*} 

(c) {ww, w G (a, 5}*}. w es w donde cada a se cambia por una b y viceversa. 

4. ¿Cierto o falso? Demuestre o dé contraejemplos. 

(a) Todo subconjunto de un lenguaje regular es regular 

(b) Todo lenguaje regular tiene un subconjunto propio regular 

(c) Si L es regular también lo es {xy, iGl, y L} 

(d) Si L es regular, también lo es (w G L, ningún prefijo propio de w pertenece a 
L}. 

(e) (te, w = w R } es regular 

(f) Si L es regular, también lo es {ta, w G L, w R G L } 

(g) Si (Li,L 2 , ...} es un conjunto infinito de lenguajes regulares, también lo es |J L¿, 
o sea la unión de todos ellos. ¿Y si el conjunto es finito? 

(h) {xyx R , x,y G E*} es regular. 


2.11 Preguntas de Controles 

A continuación se muestran algunos ejercicios de controles de años pasados, para dar una 
idea de lo que se puede esperar en los próximos. Hemos omitido (i) (casi) repeticiones, ( ii ) 
cosas que ahora no se ven, (iii) cosas que ahora se dan como parte de la materia y/o están 
en los ejercicios anteriores. Por lo mismo a veces los ejercicios se han alterado un poco o se 
presenta sólo parte de ellos, o se mezclan versiones de ejercicios de distintos años para que 
no sea repetitivo. 

C1 1996, 1997 Responda verdadero o falso y justifique brevemente (máximo 5 líneas). Una 
respuesta sin justificación no vale nada aunque esté correcta, una respuesta incorrecta 
puede tener algún valor por la justificación. 

a) Si un autómata “finito” pudiera tener infinitos estados, podría reconocer cualquier 
lenguaje. 
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b ) No hay algoritmo para saber si un autómata finito reconoce un lenguaje finito o 
infinito. 

c) La unión o intersección de dos lenguajes no regulares no puede ser regular. 

d) Si la aplicación del Lema del Bombeo para lenguajes regulares falla, entonces el 
lenguaje es regular. 

e) Dados dos lenguajes regulares L i y L 2 , existe algoritmo para determinar si el 
conjunto de prefijos de L\ es igual al conjunto de sufijos de L 2 . 

Hemos unido ejercicios similares de esos años. 

C1 1996 Suponga que tiene que buscar un patrón p en un texto, ejemplo "lolo". Queremos 
construir un autómata finito que acepte un texto si y sólo si éste contiene el patrón p. 

a) Escriba la expresión regular que corresponde a los textos que desea aceptar. 

b) Dibuje un autómata finito equivalente a la expresión regular. 

c) Para el ejemplo de p ="lolo", convierta el autómata a determinístico. Observe 
que no vale la pena generar más de un estado final, son todos equivalentes. 

ER 1996 Un autómata de múltiple entrada es igual a los normales, excepto porque puede 
tener varios estados iniciales. El autómata acepta x si comenzando de algún estado 
inicial se acepta x. 

a) Use un autómata de dos entradas para reconocer el lenguaje de todas las cadenas 

de ceros y unos sin dos símbolos iguales consecutivos. 

b) Describa formalmente un autómata de múltiple entrada, en su versión 

determinística y no determinística. Describa formalmente el conjunto de cadenas 
aceptadas por tales autómatas. 

c) ¿Los autómatas de múltiple entrada son más potentes que los normales o no? 

Demuéstrelo. 

C1 1997 Dado el lenguaje de las cadenas binarias donde nunca aparece un cero aislado: 

• Dé una expresión regular que lo genere. 

• Conviértala a un autómata no determinístico con el método visto. Simplifique el 
autómata. 

• Convierta este autómata simplificado a determinístico con el método visto. 
Simplifique el autómata obtenido. 

C1 1998, 1999 
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a) Utilice los métodos vistos para determinar si los siguientes autómatas son o no 
equivalentes. 

b) Exprese el lenguaje aceptado por el autómata de la izquierda como una expresión 
regular. 

c) Convierta el autómata de la derecha en un autómata finito determinístico. 



Se unieron distintas preguntas sobre los mismos autómatas en esos años. 

C1 1998 Dada la expresión regular a(a \ ba )* b*\ 

a) Indique todas las palabras de largo 4 que pertenecen al lenguaje representado por 
esta expresión regular. 

b) Construya un autómata finito no determinístico que reconozca este lenguaje. 

C1 1998 Es fácil determinar si una palabra pertenece o no a un lenguaje usando un 
autómata finito determínistico. Sin embargo, al pasar de un AFND a un AFD el 
número de estados puede aumentar exponencialmente, lo que aumenta el espacio 
necesario. Una solución alternativa es simular un autómata finito no determinístico. 

Escriba en pseudo-lenguaje una función Acepta(M, w ) que dado un AFND M = 
(K, E, A, s, F) y una palabra w, retorne V o F, si pertenece o no al lenguaje que 
acepta M. Puede usar la notación M.K, M.s , etc., para obtener cada elemento del 
autómata y suponer que todas las operaciones básicas que necesite ya existen (por 
ejemplo, operaciones de conjuntos). 

Ex 1999, C1 2002 Demuestre que los siguientes lenguajes no son regulares. 

a) {a n b m , n > m}. 

b) {a n b m a r , r > n}. 

C1 2000 Un transductor es una tupia M = (A', E,ú, s), donde K es un conjunto finito de 
estados, E es un alfabeto finito, s G K es el estado inicial y 

8 : K x E —> K x E* 

La idea es que un transductor lee una cadena de entrada y produce una cadena de 
salida. Si estamos en el estado q y leemos el carácter a, y ó(q,a) = ( q',x ) entonces el 
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transductor pasa al estado q' y produce la cadena x. En la representación gráfica se 
pone a/x sobre la flecha que va de q a q'. 


Por ejemplo, el transductor izquierdo de la figura elimina todos los ceros de la entrada 
y a los unos restantes los convierte en ceros. El de la derecha considera las secuencias 
seguidas de ceros o unos y las trunca para que sus longitudes sean múltiplos de 3 (ej. 
0000111000001111 000111000111 ). 



(a) Dibuje un transductor que tome las secuencias seguidas de ceros o unos 
de la entrada y sólo deje un representante de cada secuencia, por ejemplo 
001110011001000111 ->■ 01010101 . 

( b ) Defina formalmente la función salida ( S ) de un transductor, que recibe la cadena 
de entrada y entrega la salida que producirá el transductor. Ayuda: defina 
S(w) = T(s,w), donde T(q,w) depende del estado actual del transductor, y 
luego considere los casos w — £ y w — a ■ w', es decir la letra a concatenada con 
el resto de la cadena, w'. 

(c) El lenguaje de salida de un transductor es el conjunto de cadenas que puede 
producir (es decir {S(w), w G £*}). Demuestre que el lenguaje de salida de un 
transductor es regular. Ayuda: dado un transductor, muestre cómo obtener el 
AFND que reconozca lo que el transductor podría generar. 

C1 2001 Demuestre que si L es un lenguaje regular entonces el lenguaje de los prefijos 
reversos de cadenas de L también es regular. Formalmente, demuestre que L' = 
{x R , 3 y, xy € L} es regular. 

C1 2001 Intente usar el Lema de Bombeo sin la restricción \xy\ < N para probar que 
L = {w E {a, b}*, w = w R } no es regular. ¿Por qué falla? Hágalo ahora con el Lema 
con la restricción. 
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C1 2002 Dada la expresión regular (AA | AT) ( (AG | AAA) *), realice lo siguiente usando los 
métodos vistos: 

(a) Construya el autómata finito no determinístico que la reconoce. 

( b ) Convierta el autómata obtenido a determinístico. 

C1 2004 Considere la expresión regular (AB | CD) *AFF*. 

(a) Construya el AFND correspondiente. 

( b ) Convierta el AFND en AFD. Omita el estado sumidero y las aristas que llevan a 

él. El resultado tiene 7 estados. 

(c) Minimice el AFD, usando la regla siguiente: si dos estados q y q' son ambos finales 

o ambos no finales, de ellos salen aristas por las mismas letras, y las aristas que 
salen de ellos por cada letra llevan a los mismos estados, entonces q y q' se pueden 
unir en un mismo estado. Reduzca el AFD a 5 estados usando esta regla. 

(d) Convierta el AFD nuevamente en expresión regular. 

C1 2004 Demuestre que: 

1. Si L es regular, nosubstr(L) es regular (nosubstr(L) es el conjunto de cadenas 
que no son substrings de alguna cadena en L ). 

2. Si L es regular, Ext(L) es regular ( Ext(L ) es el conjunto de cadenas con algún 
prefijo en L, Ext(L ) = {xy, x G L}). 

Ex 2005 Un Autómata Finito de Doble Dirección (AFDD) se comporta similarmente a un 
Autómata Finito Determinístico (AFD), excepto porque tiene la posibilidad de volver 
hacia atrás en la lectura de la cadena. Es decir, junto con indicar a qué estado pasa 
al leer un carácter, indica si se mueve hacia atrás o hacia adelante. El autómata 
termina su procesamiento cuando se mueve hacia adelante del último carácter. En este 
momento, acepta la cadena sii a la vez pasa a un estado final. Si nunca pasa del último 
carácter de la cadena, el AFDD no la acepta. Si el AFDD trata de moverse hacia atrás 
del primer carácter, este comando se ignora y permanece en el primer carácter. 

Defina formalmente los AFDDs como una tupia de componentes; luego defina lo que es 
una configuración; cómo es una transición entre configuraciones; el concepto de aceptar 
o no una cadena; y finalmente defina el lenguaje aceptado por un AFDD. 

C1 2006 Sean L\ y L 2 lenguajes regulares. Se define 

cilt{x\x 2 • • • x n , y\y 2 ... yn) %iyix 2 y 2 ... x n y n 
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y se define el lenguaje 

L = {alt(x,y), x e L u ye L 2 , |x| = \y\} 

Demuestre que L es regular. 

C1 2006 Sea L C {a, b}* el lenguaje de las cadenas donde todos los bloques de a’s 
tienen el mismo largo (un bloque es una secuencia de a’s consecutivas). Por ejemplo 
bbbaabaabbaa G L, abbabababba G L, aaaabbaaaabaaaa G L. baabbbaba L. 

Demuestre que L no es regular. 

Ex 2007 Se define un nuevo tipo de AFND llamado “autómata universal”, el cual acepta 
una entrada siempre que por todos los caminos posibles llegue a un estado final (y por 
lo menos llegue a alguno). 

1. ¿Qué lenguaje reconoce el siguiente autómata universal? 



2 . Formalice la noción de autómata universal. Sólo debe indicar la nueva definición 
de C(M), mediante h* y el resto de las definiciones usuales. 

3. Demuestre que los lenguajes reconocidos por autómatas universales son 
exactamente los lenguajes regulares. 

C1 2008 Considere la expresión regular a(ba*)*. 

1. Dibuje el AFND correspondiente según el método visto en clases (Thompson). 

2. Conviértalo a un AFD con el método visto en clases. 

3. Obtenga (manualmente) un AFD equivalente con 4 estados, y una expresión 
regular alternativa a la del enunciado. 

2.12 Proyectos 

1 . Investigue sobre minimización de AFDs. Una posible fuente es [ASU86], desde página 
135. Otra es [HMU01], sección 4.4, desde página 154. 
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2. Investigue sobre métodos alternativos a Thompson para convertir una ER en AFND. 
Por ejemplo, el método de Glushkov se describe en [NR02], sección 5.2.2, desde página 
105. 

3. Investigue una forma alternativa de convertir AFDs en ERs, donde los estados se van 
eliminando y se van poniendo ERs cada vez más complejas en las aristas del autómata. 
Se describe por ejemplo en [HMU01], sección 3.2.2, desde página 96. 

4. Investigue sobre implementación eficiente de autómatas. Algunas fuentes son [NR02], 
sección 5.4, desde página 117; y [ASU86], sección 3.9, desde página 134. También 
puede investigar la implementación de las herramientas grep de Gnu y lex de Unix. 

5. Programe el ciclo completo de conversión ER —> AFND —> AFD —> ER. 

6 . Programe un buscador eficiente de ERs en texto, de modo que reciba una ER y lea la 
entrada estándar, enviando a la salida estándar las líneas que contienen una ocurrencia 
de la ER. 


Referencias 

[ASU86] A. Alio, R. Sethi, J. Ullman. Compilers: Principies, Techniques, and Tools. 
Addison-Wesley, 1986. 

[HMU01] J. Hopcroft, R. Motwani, J. Ullman. Introduction to Autómata Theory, Languages, 
and Computation. 2nd Edition. Pearson Education, 2001. 

[LP81] H. Lewis, C. Papadimitriou. Elements of the Theory of Computation. Prentice-Hall, 
1981. Existe una segunda edición, bastante parecida, de 1998. 

[NR02] G. Navarro, M. Raffinot. Flexible Pattern Matching in Strings. Cambridge 
University Press, 2002. 



CAPÍTULO 2. 


LENGUAJES REGULARES 



Capítulo 3 

Lenguajes Libres del Contexto 


[LP81, cap 3] 

En este capítulo estudiaremos una forma de representación de lenguajes más potentes 
que los regulares. Los lenguajes libres del contexto (LC) son importantes porque sirven 
como mecanismo formal para expresar la gramática de lenguajes de programación o los 
semiestructurados. Por ejemplo la popular “Backus-Naur form” es esencialmente una 
gramática libre del contexto. Similarmente, los DTDs usados para indicar el formato 
permitido en documentos XML son esencialmente gramáticas que describen lenguajes LC. 
Los lenguajes LC también se usan en biología computacional para modelar las propiedades 
que se buscan en secuencias de ADN o proteínas. El estudio de este tipo de lenguajes 
deriva en la construcción semiautomática de parsers (reconocedores) eficientes, los cuales son 
esenciales en la construcción de compiladores e intérpretes, así como para procesar textos 
semiestructurados. Una herramienta conocida para esta construcción semiautomática es 
lex/yacc en C/Unix, y sus distintas versiones para otros ambientes. Estas herramientas 
reciben esencialmente una especificación de un lenguaje LC y producen un programa que 
parsea tal lenguaje. 

En términos teóricos, los lenguajes LC son interesantes porque van más allá de la memoria 
finita sobre el pasado permitida a los regulares, pudiendo almacenar una cantidad arbitraria 
de información sobre el pasado, siempre que esta información se acceda en forma de pila. Es 
interesante ver los lenguajes que resultan de esta restricción. 


3.1 Gramáticas Libres del Contexto (GLCs) [lpsi, sec s.ij 

Una gramática libre del contexto (GLC) es una serie de reglas de derivación, producción o 
reescritura que indican que un cierto símbolo puede convertirse en (o reescribirse como) una 
secuencia de otros símbolos, los cuales a su vez pueden convertirse en otros, hasta obtener 
una cadena del lenguaje. Es una forma particular de sistema de reescritura, restringida a que 
las reglas aplicables para reescribir un símbolo son independientes de lo que tiene alrededor 
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en la cadena que se está generando (de allí el nombre “libre del contexto”). 

Distinguiremos entre los símbolos terminales (los del alfabeto E que formarán la cadena 
final) y los símbolos no terminales (los que deben reescribirse como otros y no pueden aparecer 
en la cadena final). Una GLC tiene un símbolo inicial del que parten todas las derivaciones, 
y se dice que genera cualquier secuencia de símbolos terminales que se puedan obtener desde 
el inicial mediante reescrituras. 

Ejemplo 3.1 Consideremos las siguientes reglas de reescritura: 

5 —> aSb 
S —> £ 

donde S es el símbolo (no terminal) inicial, y {a, b} son los símbolos terminales. Las cadenas que 
se pueden generar con esta GLC forman precisamente el conjunto {a n b n , n > 0}, que en el Ej. 2.22 
vimos que no era regular. De modo que este mecanismo permite expresar lenguajes no regulares. 

Formalicemos ahora lo que es una GLC y el lenguaje que describe. 

Definición 3.1 Una gramática libre del contexto (GLC) es una tupia G = (V, E ,R,S), 
donde 

1. V es un conjunto finito de símbolos no terminales. 

2. E es un conjunto finito de símbolos terminales, V fl E = 0. 

3. S G V es el símbolo inicial. 

4■ RC F V x (LUE)* son las reglas de derivación (conjunto finito). 

Escribiremos las reglas de R como A —>g z o simplemente A —* z en vez de ( A , z). 

Ahora definiremos formalmente el lenguaje descrito por una GLC. 

Definición 3.2 Dada una GLC G = (V, E, R, S ), la relación lleva en un paso (E U 

E)* x (hU E)* se define como 

Va:, y, VA —» z G R, xAy ==^g xzy. 


Definición 3.3 Definimos la relación lleva en cero o más pasos, =>g, como la clausura 
reflexiva y transitiva de ==>g- 

Escribiremos simplemente =>• y ==^* cuando G sea evidente. 

Notamos que se puede llevar en cero o más pasos a una secuencia que aún contiene no 
terminales. Las derivaciones que nos interesan finalmente son las que llevan del símbolo 
inicial a secuencias de terminales. 



3.1. GRAMATICAS LIBRES DEL CONTEXTO (GLCS) 


45 


Definición 3.4 Dada una GLC G = (V, E, R, S), definimos el lenguaje generado por G, 
C[G), como 

C{G) = {roeE* 


Finalmente definimos los lenguajes libres del contexto como los expresables con una GLC. 

Definición 3.5 Un lenguaje L es libre del contexto (LC) si existe una GLC G tal que 
L = C{G). 

Ejemplo 3.2 ¿Cómo podrían describirse las secuencias de paréntesis bien balanceados? (donde 
nunca se han cerrado más paréntesis de los que se han abierto, y al final los números coinciden). 
Una GLC que lo describa es sumamente simple: 

S —> ( S)S 
S —> e 

la que formalmente se escribe como V = {5}, £ = {(,)}, R = {(5, (S)S), (5, e)}. Una derivación 
de la cadena (())() a partir de S podría ser como sigue: 

S => (S)S =*► (( S)S)S => (( ) 5)5 =t> (())5 => (0)(S)S => (())()5 => (())(), 

y otra podría ser como sigue: 

s => (S)S => ( 5 )( 5)5 =*► ( 5)()5 => (5)0 =*► ((5)5)0 =*► (QS)Q =*► (())()• 

Esto ilustra un hecho interesante: existen distintas derivaciones para una misma cadena, 
producto de aplicar las reglas en distinto orden. 

Observación 3.1 ¿Puede el lenguaje del Ej. 3.2 ser regular? No, pues entonces su 
intersección con (*)* también lo sería, pero esa intersección es {( n ) n , n > 0}, que ya sabemos 
que no es regular. 

Lina herramienta muy útil para visualizar derivaciones, y que se independiza del orden 
en que se aplican las reglas, es el árbol de derivación. 

Definición 3.6 Un árbol de derivación para una gramática G = (V, E, R , S) es un árbol 
donde los hijos tienen orden y los nodos están rotulados con elementos de V ó E ó e. La 
raíz está rotulada con S, y los nodos internos deben estar rotulados con elementos de V. Si 
los rótulos de los hijos de un nodo interno rotulado A son ai... a^, k > 1 y oq e V U E, debe 
existir una regla A —> cp... a*, G R. Si un nodo interno rotulado A tiene un único hijo 
rotulado e, debe haber una regla A —> e e R. Diremos que el árbol genera la cadena que 
resulta de concatenar todos los símbolos de sus hojas, de izquierda a derecha, vistos como 
cadenas de largo 1 (o cero para e). 
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Observar que la definición permite qne un árbol de derivación tenga símbolos no 
terminales en sus hojas, es decir, puede representar una derivación parcial. El siguiente 
lema es inmediato. 

Lema 3.1 Si un árbol de derivación para G genera x G (V US)*, entonces S x. Si 
S x, existe un árbol de derivación que genera x. 

Prueba: Muy fácil por inducción estructural sobre el árbol o por inducción sobre la longitud de 
la derivación, según el caso. □ 

Ejemplo 3.3 El árbol de derivación para la cadena del Ej. 3.2 es como sigue: 



( s ) S ( S ) s 


e e e e 

y abstrae de ambos órdenes de derivación. 

Sin embargo, los distintos órdenes de derivación no son los únicos responsables de que 
existan distintas formas de derivar una misma cadena. Es posible que una misma cadena 
tenga dos árboles de derivación distintos. 

Definición 3.7 Una GLC G es ambigua si existen dos árboles de derivación distintos para 
G que generan una misma cadena w € C(G). 

Generalmente ser ambigua es una propiedad indeseable para una GLC. Veamos un 
ejemplo de una GLC ambigua. 

Ejemplo 3.4 La siguiente GLC describe un subconjunto de expresiones aritméticas correctas. 

D 

DN 
0 

9 


E - 

->• E + E 

N 

E - 

E * E 

N 

E - 

(E) 

D 

E - 

-> N 

D 



D 
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donde V = {E, N, D}, E es el símbolo inicial, y todos los demás son terminales. 

Por ejemplo, 2 + 3*5 pertenece al lenguaje generado por esta GLC, pero tiene dos árboles de 
derivación distintos: 


E E 



¡y E * E E + E 


D 


N 


D 


N 


D 


N 


D 


N 


D 


D 


Dado que lo normal es asignar semántica a una expresión a partir de su árbol de derivación, el 
valor en este ejemplo puede ser 25 ó 17 según qué árbol utilicemos para generarla. 


Cuando se tiene una gramática ambigua, podemos intentar desambiguarla, mediante 
escribir otra que genere el mismo lenguaje pero que no sea ambigua. 

Ejemplo 3.5 La siguiente GLC genera el mismo lenguaje que la del Ej. 3.4, pero no es ambigua. 
La técnica usada ha sido distinguir lo que son sumandos (o términos T) de factores (F), de modo 
de forzar la precedencia *, +. 

E —> E + T 
E —y T 
T —> T * F 
T —y F 
F —► (E) 

F — y N 

Ahora el lector puede verificar que 2 + 3*5 sólo permite la derivación que queremos, pues hemos 
obligado a que primero se consideren los sumandos y luego los factores. 


N 

N 

D 

D 

D 


D 

DN 

0 


9 
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3.2 Todo Lenguaje Regular es Libre del Contexto 

[LP81, sec 3.2] 


Hemos ya mostrado (Ej. 3.1) que existen lenguajes LC que no son regulares. Vamos 
ahora a completar esta observación con algo más profundo: el conjunto de los lenguajes LC 
incluye al de los regulares. 


Teorema 3.1 Si L CE* es un lenguaje regular, entonces L es LC. 

Prueba: Lo demostramos por inducción estructural sobre la ER que genera L. Sería más fácil 
usando autómatas finitos y de pila (que veremos enseguida), pero esta demostración ilustra otros 
hechos útiles para más adelante. 

1. Si L = 0, la GLC G = ({S}, X, 0, S) genera L. ¡Esta es una GLC sin reglas! 

2. Si L = {a}, la GLC G = ({5}, X, {S —> a}, S ) genera L. 

3. Si L = L\ U L 2 y tenemos (por hipótesis inductiva) GLCs G 1 = (Vi, X, Rj, Si) y G 2 = 
(Vj, X, i? 2 > S 2 ) que generan L 4 y L 2 respectivamente, entonces la GLC G = (Vj U Vj U 
{5}, X, R\ U i ?2 U {S —> S\, S —> S 2 }, S ) genera L. 

4. Si L = L\ o L 2 y tenemos GLCs G\ = (Vj, X, R\, Si) y Gj = (Vj, X, R 2 , S 2 ) que generan Li 

y L 2 respectivamente, entonces la GLC G = (Vj U Vj U {S}, X, R\ U Rj U {S —> S 1 S 2 }, S) 

genera L. 

5. Si L = L\ y tenemos una GLC G\ = (Vj, X, Rj, Si) que genera L\, entonces la GLC G = 
(Vj U {S}, X, R\ U {S —> S\S, S —> e}, S) genera L. 

□ 


Ejemplo 3.6 Si derivamos una GLC para (a * 


b) * a obtendremos 


s - 

-r SiS 2 

Si - 

->• S 3 S 1 

Si - 

£ 

S 3 - 

s 4 

S 3 - 



s 4 - 

5 6 s 4 

5 4 - 

£ 

S(j - 

Cl 

S 5 - 

b 

S 2 - 

a 


El Teo. 3.1 nos muestra cómo convertir cualquier ER en una GLC. Con esto a mano, nos 
permitiremos escribir ERs en los lados derechos de las reglas de una GLC. 

Ejemplo 3.7 La GLC del Ej. 3.5 se puede escribir de la siguiente forma. 

E + T | T 
T * F \ F 
(E) | DD -k 
0 |... | 9 

si bien, para cualquier propósito formal, deberemos antes convertirla a la forma básica. 
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Ejemplo 3.8 Tal como con ERs, no siempre es fácil diseñar una GLC que genere cierto lenguaje. 
Un ejercicio interesante es {re € {a,b}*, vj tiene la misma cantidad de a's y 6’s }. Una respuesta 
sorprendentemente sencilla es S —> e \ aSbS \ bSaS. Es fácil ver por inducción que genera 
solamente cadenas correctas, pero es un buen ejercicio convencerse de que genera todas las cadenas 
correctas. 


3.3 Autómatas de Pila (AP) [lpsi, sec s.s] 

Tal como en el Capítulo 2, donde teníamos un mecanismo para generar lenguajes regulares 
(las ERs) y otro para reconocerlos (AFDs y AFNDs), tendremos mecanismos para generar 
lenguajes LC (las GLCs) y para reconocerlos. Estos últimos son una extensión de los 
AFNDs, donde además de utilizar el estado del autómata como memoria del pasado, es 
posible almacenar una cantidad arbitraria de símbolos en una pila. 

Un autómata de pila (AP) se diferencia de un AFND en que las transiciones involucran 
condiciones no sólo sobre la cadena de entrada sino también sobre los símbolos que hay en 
el tope de la pila. Asimismo la transición puede involucrar realizar cambios en el tope de la 
pila. 

Ejemplo 3.9 Consideremos el siguiente AP: 

a,_j# b,#,_ 

b,#,_ 


Las transiciones se leen de la siguiente manera: (a, #) significa que, al leerse una a, 

independientemente de los caracteres que haya en el tope de la pila (_), se apilará un símbolo 
# y se seguirá la transición; (b, #, _) significa que, al leerse una 6, si hay un símbolo jf en el tope de 
la pila, se desapilará (es decir, se reemplazará por _, que denota la cadena vacía en los dibujos). El 
AP acepta la cadena sólo si es posible llegar a un estado final habiendo consumido toda la entrada 
y quedando con la pila vacía. Es fácil ver que el AP del ejemplo acepta las cadenas del lenguaje 
{a n b n , n > 0}. Notar que el estado 0 es final para poder aceptar la cadena vacía. 

Observación 3.2 Notar que una condición _ sobre la pila no quiere decir que la pila debe 
estar vacía. Eso no se puede expresar directamente. Lo que se puede expresar es “en el tope 
de la pila deben estar estos caracteres”. Cuando esa condición es _ lo que se está diciendo 
es que no hay ninguna condición sobre el tope de la pila, es decir, que los cero caracteres del 
tope de la pila deben formar e, lo que siempre es cierto. 

Ejemplo 3.10 ¿Cómo sería un AP que reconociera las cadenas de {wcw R , w € {a, 6}*}? Esta 
vez debemos recordar qué carácter vimos antes, no basta con apilar contadores ff: 
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Una pregunta un poco más complicada es: ¿cómo aceptar {ww R , w € {a, 6}*}? ¡Esta vez 
no tenemos una marca (c) que nos indique cuándo empezar a desapilar! La solución se basa en 
explotar el no determinismo intrínseco de los APs: 



De este modo el AP adivina qué transición elegir (es decir cuándo empezar a desapilar), 
tal como lo hacían los AFNDs. 

Algunas veces es más fácil diseñar un AP que una GLC para describir un cierto lenguaje. 
Por ejemplo, sin entrenamiento previo no es sencillo dibujar un AP que reconozca el lenguaje 
del Ej. 3.5, mientras que el siguiente ejemplo muestra la situación opuesta. 

Ejemplo 3.11 Generar un AP que reconozca el lenguaje del Ej. 3.8 es bastante más intuitivo, y 
es más fácil ver que funciona correctamente. Esencialmente el AP almacena en la pila el exceso de 
a’s sobre V s o viceversa. Cuando la pila está vacía las cantidades son iguales. Sino, la pila debería 
contener sólo a’s o sólo b's. La idea es que, cuando se recibe una a y en el tope de la pila hay una 
b, se “cancelan” consumiendo la a y desapilando la b, y viceversa. Cuando se reciba una a y en la 
pila haya exceso de a’s, se apila la nueva a, y lo mismo con b. El problema es que debe ser posible 
apilar la nueva letra cuando la pila está vacía. Como no puede expresarse el hecho de que la pila 
debe estar vacía, presentamos dos soluciones al problema. 



b,Z,bZ 
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Comencemos por el AP de la izquierda. Este AP puede siempre apilar la letra que viene (en 
particular, si la pila está vacía). Puede apilar incorrectamente una a cuando la pila contiene 6’s, 
en cuyo caso puede no aceptar una cadena que pertenece al lenguaje (es decir, puede quedar con 
la pila no vacía, aunque ésta contenga igual cantidad de a’s y 6’s). Sin embargo, debe notarse que 
el AP es no determinístico, y basta con que exista una secuencia de transiciones que termine en 
estado final con la pila vacía para que el AP acepte la cadena. Es decir, si bien hay caminos que en 
cadenas correctas no vacían la pila, siempre hay caminos que lo hacen, y por ello el AP funciona 
correctamente. 

El AP de la derecha es menos sutil pero es más fácil ver que es correcto. Además ilustra una 
técnica bastante común para poder detectar la pila vacía. Primero se apila un símbolo especial Z, 
de modo que luego se sabe que la pila está realmente vacía cuando se tiene Z en el tope. Ahora 
las transiciones pueden indicar precisamente qué hacer cuando viene una a según lo que haya en el 
tope de la pila: 6 (cancelar), a (apilar) y Z (apilar); similarmente con b. Obsérvese cómo se indica 
el apilar otra a cuando viene una a: la a del tope de la pila se reemplaza por aa. Finalmente, con 
la pila vacía se puede desapilar la Z y pasar al estado final. 

Es hora de definir formalmente un AP y su funcionamiento. 

Definición 3.8 Un autómata de pila (AP) es una tupia M = (. K , E, T, A, s, F), tal que 

• K es un conjunto finito de estados. 

• E es un alfabeto finito. 

• T es el alfabeto de la pila, finito. 

• s G K es el estado inicial. 

• F C K son los estados finales. 

• A C F (K xE’x T*) x (K x T*), conjunto finito de transiciones. 


Las transiciones ((q,x,a),(q r , ¡3)) son las que hemos graficado como flechas rotuladas 
“x, a, /3” que va de q a q', y se pueden recorrer cuando viene x en la entrada y se lee a (de 
arriba hacia abajo) en el tope de la pila, de modo que al pasar a q' ese a se reemplazará por 

fi. 

Ejemplo 3.12 El segundo AP del Ej. 3.11 se describe formalmente como M = ( K , E, T, A, s, F ), 
donde I\ = {0,1, 2}, E = {a, 6}, T = {a, b, Z}, s = 0, F = {2}, y 

A = { ((0,£,e), (1 ,Z)), ((1,£, Z), (2,e)), 

((l,a,6), (1, £)), ((l,o, a), (l,aa)), ((1, a, Z), (1, aZ)), 

((1, b, a), (1, £)), ((1,6,6), (1,66)), ((1, b, Z), (1, bZ)) } 
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Nuevamente definiremos la noción de configuración, que contiene la información necesaria 
para completar el cómputo de un AP. 

Definición 3.9 Una configuración de un AP M = (K, E, T, A, s, F ) es un elemento de 
C M = K xE’xP. 

La idea es que la configuración (q, x, 7 ) indica que AI está en el estado q. le falta leer la 
cadena x de la entrada, y el contenido completo de la pila (de arriba hacia abajo) es 7 . Esta 
es información suficiente para predecir lo que ocurrirá en el futuro. 

Lo siguiente es describir cómo el AP nos lleva de una configuración a la siguiente. 

Definición 3.10 La relación lleva en un paso, \~mQ Cm x Cm, para un AP AL = 
(K, E, T, A, s, F), se define de la siguiente manera: (q,xy,a , y) \~ M (q',y,/3'y) sii 
i(q,x,a), W,P)) e A. 

Definición 3.11 La relación lleva en cero o más pasos \~* M es la clausura reflexiva y 
transitiva de h m- 

Escribiremos simplemente h y b* en vez de \~ M y \~* M cuando quede claro de qué M 
estamos hablando. 

Definición 3.12 El lenguaje aceptado por un AP M = (K, E, T, A, s, F) se define como 
£(M) = {xeE*, 3feF, (s,x,e) b* f 


Ejemplo 3.13 Tomemos el segundo AP del Ej. 3.10, el que se describe formalmente como 
M = (K, E, T, A, s, F), donde K = {0,1}, E = T = {a, 6 }, s = 0, F = {1}, y A = 
{(( 0 ,a,e), ( 0 ,a)), (( 0 , 6 , e), ( 0 , 6 )), (( 0 ,e,e), (l,e)), ((l,a,a), (l,e)), ((1, b, b), (1, e))}. 

Consideremos la cadena de entrada x = abbbba y escribamos las configuraciones por las que 
pasa M al recibir x como entrada: 


( 0 , abbbba, e) b ( 0 , 6666 a, a) b ( 0 , 666 a, 6 a) b ( 0 , 66 a, 66 a) 
b ( 1 , 66 a, 66 a) b ( 1 , 6 a, 6 a) b (l,a, a) b (l,e,e). 

Por lo tanto (0, x, e) b* (1, e, e), y como 1 G F, tenemos que x € C(M). Notar que existen otros 
caminos que no llevan a la configuración en que se acepta la cadena, pero tal como los AFNDs, la 
definición indica que basta que exista un camino que acepta x para que el AP acepte x. 
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3.4 Conversión de GLC a AP [lpsi, sec 3.4] 

Vamos a demostrar ahora que ambos mecanismos, GLCs y APs, son equivalentes para 
denotar lenguajes libres del contexto. Comenzaremos con la conversión más sencilla. 

Definición 3.13 Sea G = (V, E ,R,S) una GLC. Entonces definiremos ap(G ) = 

(K, E, T, A, s, F ) de la siguiente manera: K = {s, /} (es decir el AP tiene sólo dos estados), 
T = V U E (podemos apilar símbolos terminales y no terminales), F = {/}, y 

A = {((s, £,£),(/, 5))} 

U {((/, a, a), (/,£)), a e E} 
u {((/, A A ), (/, *)), A —> ze R} 


La idea de ap(G) es que mantiene en la pila lo que aún espera leer. Esto está expresado 
como una secuencia de terminales y no terminales. Los terminales deben verse tal como 
aparecen, y “ver” un no terminal significa ver cualquier cadena de terminales que se pueda 
derivar de él. Por ello comienza indicando que espera ver S, cancela un terminal de la 
entrada con el que espera ver según la pila, y puede cambiar un no terminal del tope de 
la pila usando cualquier regla de derivación. Nótese que basta un AP de dos estados para 
simular cualquier GLC. Esto indica que los estados no son la parte importante de la memoria 
de un AP, sino su pila. 

Ejemplo 3.14 Dibujemos ap(G ) para la GLC del Ej. 3.1. El AP resultante es bastante distinto 
de los que mostramos en el Ej. 3.9. 

a,a,_ 


b,b,_ 



También es ahora muy fácil generar el AP para la GLC del Ej. 3.5, lo cual originalmente no era 
nada sencillo. 

Obtener el AP de una GLC es el primer paso para poder hacer el parsing de un lenguaje 
LC. Demostraremos ahora que esta construcción es correcta. 
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Teorema 3.2 Sea G una GLC, entonces C(G) = £(a,p(G)). 

Prueba: El invariante es que en todo momento, si x es la cadena ya leída y 7 es el contenido de 
la pila, entonces S x'y. Este invariante se establece con la primera transición de s a /. Si en 
algún momento se ha leído toda la entrada x y la pila está vacía, es inmediato que x G C(G). Es muy 
fácil ver que los dos tipos de transición mantienen el invariante, pues las que desapilan terminales 
de la entrada simplemente mueven el primer carácter de 7 al final de x, y las que reemplazan un 
no terminal por la parte derecha de una regla ejecutan un paso de =^g- Con esto demostramos 
que x € C(ap(G)) =7- x € L(G), es decir toda cadena aceptada por el AP es generada por la GLC. 
Para ver la vuelta, basta considerar una secuencia de pasos que genere x desde S, donde el 

no terminal que se expanda siempre sea el de más a la izquierda. Se puede ver entonces que el AP 
puede realizar las transiciones consumiendo los terminales que aparecen al comienzo de la cadena 
que se va derivando y reemplazando los no terminales del comienzo por la misma regla que se usa 
en la derivación de x. □ 


3.5 Conversión a AP a GLC [lpsi, sec 3 . 4 ] 

Esta conversión es un poco más complicada, pero imprescindible para demostrar la 
equivalencia entre GLCs y APs. La idea es generar una gramática donde los no terminales 
son de la forma ( p , A, q) y expresen el objetivo de llegar del estado p al estado q , partiendo 
con una pila que contiene el símbolo A y terminando con la pila vacía. Permitiremos también 
objetivos de la forma (p, e, q), que indican llegar de p a q partiendo y terminando con la pila 
vacía. Usando las transiciones del AP, reescribiremos algunos objetivos en términos de otros 
de todas las formas posibles. 

Para simplificar este proceso, supondremos que el AP no pone condiciones sobre más de 
un símbolo de la pila a la vez. 


Definición 3.14 Un AP simplificado M = (A', E, T, A, s, F ) cumple que ((p, x, a), (g, (3)) G 
A =7» Icel < 1. 


Es fácil “simplificar” un AP. Basta reemplazar las transiciones de tipo 
((p, x, aia 2 a 3 ), (q, (3)) por una secuencia de estados nuevos: ((p, x, ai), (pi, s)), 

((pi, e, a 2 ), (p 2 , £)), ((p 2 , e, a 3 ), (q, /3)). Ahora definiremos la GLC que se asocia a un 
AP simplificado. 


Definición 3.15 Sea M = (K, E, T, A, s, F) un AP simplificado. Entonces la GLC 
glc(M) = (V, E, A, S) se define como V = {A} U ( K x (fU {e}) x K), y las siguientes 
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reglas. 

R = {s— feF} 

u {( p,e,p )— >e, peK} 

U {(p, A, r) —> x(q, e, r), ((p, x, A), (q, e)) E A, r E K} 

U {(p, e, r) —> x(q, £, r ), ((p, x, e), (q, e)) E A, re /í } 

U {(p,Ar)— >x(q,A,r ), ((p,x,e), (g,e)) e A, re/í, AeT} 

U {(p,A,r) —> x(g, Si,ri)(ri,S 2 ,r 2 ) (r fc _i, B k , r), 

((p, V A), (<?, B1B2 ... B k )) E A, n, r 2 , ..., r fc _i, r e A'} 
U {( p,£,r ) —> x(g, J B 1 ,ri)(ri, J B 2 ,r 2 )... (r fe _i, r), 

((p,a;,e), (g, .. .5*,)) e A, rq, r 2 , ■ ■ ■, r fc _i, r e A'} 

U {(p, A, r) — > x(g, Ai,ri)(ri,5 2 ,r 2 ) ... {r k -\ , B k ,r k )(r k , A,r), 
((P,x,e), (q, AiA 2 .. .B k )) E A, r 1, r 2 ,... ,r k ,r E K} 


Vamos a explicar ahora el funcionamiento de glc(M). 

Teorema 3.3 Sea M un AP simplificado, entonces £(M) = C(glc(M)). 

Prueba: Como se explicó antes, las tupias (p, A, q) o (p, e, q ) representan objetivos a cumplir, o 
también el lenguaje de las cadenas que llevan de p a q eliminando A de la pila o yendo de pila vacía 
a pila vacía, respectivamente. La primera línea de R establece que las cadenas que acepta el AP 
son las que lo llevan del estado inicial s hasta algún estado final f E F, partiendo y terminando 
con la pila vacía. La segunda línea establece que la cadena vacía me lleva de p a p sin alterar la 
pila (es la única forma de eliminar no terminales en la GLC). La tercera línea dice que, si queremos 
pasar de p a algún r consumiendo A de la pila en el camino, y tenemos una transición del AP 
que me lleva de p a q consumiendo x de la entrada y A de la pila, entonces una forma de cumplir 
el objetivo es generar x y luego ir de q a r partiendo y terminando con la pila vacía. La cuarta 
línea es similar, pero la transición no altera la pila, por lo que me sirve para objetivos del tipo 
(p,e,r). Sin embargo, podría usar esa transición también para objetivos tipo ( p,A,q ), si paso a 
q y dejo como siguiente objetivo (q,A,r) (quinta línea). Las últimas tres líneas son análogas a 
las líneas 3—5, esta vez considerando el caso más complejo en que la transición no elimina A de la 
pila sino que la reemplaza por B1B2 ■ ■ ■ B k . En ese caso, el objetivo de ir de p a r se reemplaza 
por una secuencia de objetivos, cada uno de los cuales se encarga de eliminar una de las de 
la pila por vez, pasando por estados intermedios desconocidos (y por eso se agregan reglas para 
usar todos los estados intermedios posibles). Esto no constituye una demostración sino más bien 
una explicación intuitiva de por qué glc(M) debería funcionar como esperamos. Una demostración 
basada en inducción en el largo de las derivaciones se puede encontrar en el libro [LP81]. □ 

Ejemplo 3.15 Calculemos glc(M) para el AP de la izquierda del Ej. 3.11, que tiene un sólo 
estado. La GLC resultante es 
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S 

<0,e,0> 
( 0 , 6 , 0 ) 
(o, £, 0) 
(o, 0,0) 
( 0 , 6 , 0 ) 
(o, 0,0) 

(0,e,0) 
( 0 , 6 , 0 ) 
(O, a,0) 


(0,e,0) 

6 

a(0, e, 0) 
a(0, a, 0) 
a(0, a, 0) (O, a, 0) 
a(O, a, 0) (O, 6,0) 
6 ( 0 , 6 , 0 ) 

6 ( 0 , 6 , 0 ) 

6 (0,6,0) (0,6,0) 
6 (0,6,0) (O, a, 0) 


primera línea Def. 3.15 
segunda línea Def. 3.15 
generada por ((O, a, 6), (O, e)) 
generadas por ((O, a, s), (O, a)) 


generada por ((O, 6, a), (O, e)) 
generadas por ((O, 6, e), (O, 6)) 


Para hacer algo de luz sobre esta GLC, podemos identificar (0,6, 0) con S, y llamar B a (0, a, 0) 
yia (0,6,0). En ese caso obtendremos una solución novedosa al problema original del Ej. 3.8. 


S —>■ e | aB | bA 
A —> aS | bAA | aBA 
B —y bS \ aBB \ bAB 

Es fácil comprender cómo funciona esta gramática que hemos obtenido automáticamente. A 
representa la tarea de generar una a de más, B la de generar una 6 de más, y S la de producir 
una secuencia balanceada. Entonces S se reescribe como: la cadena vacía, o bien generar una 
a y luego compensarla con una B, o bien generar una 6 y luego compensarla con una A. A se 
reescribe como: compensar la a y luego generar una secuencia balanceada S , o bien generar una 
6 (aumentando el desbalance) y luego compensar con dos A’s. Similarmente con B. Las terceras 
alternativas A —?• aBA y B —bAB son redundantes. Observar que provienen de apilar una letra 
incorrectamente en vez de cancelarla con la letra de la pila, como se discutió en el Ej. 3.11. 


Ejemplo 3.16 Repitamos el procedimiento para el AP del Ej. 3.9. Este tiene dos estados, por lo 
que la cantidad de reglas que se generarán es mayor. 


S 

S 

( 0 , 6 , 0 ) 

(M, i) 

( 0 , 6 , 0 ) 

( 0 , 6 , 1 ) 

( 0 ,#, 0 ) 

( 0 ,#, 0 ) 

( 0 ,#, 1 ) 

( 0 , #, 1 ) 

( 0 ,#, 0 ) 

( 0 ,#, 1 ) 

( 1 ,#, 0 ) 

( 1 ,#, 1 ) 


( 0 , 6 , 0 ) 
( 0 , 6 , 1 ) 



O(0,#,0) 

a(0, #, 1) 

o(0,#,0)(0,#,0) 

o(0 ,#,l)(l,#,0) 

o(0,#,0)(0,#,l) 

a(0, #, 1) (1, #, 1) 

6 ( 1 , 6 , 0 ) 

6 ( 1 , 6 , 1 ) 

6(1, e,0) 

6 ( 1 , 6 , 1 ) 


primera línea Def. 3.15 
segunda línea Def. 3.15 
generadas por ((0, a, e), (0, #)) 


generadas por ((0, 6, #), (1, e)) 
generadas por ((1, 6, #), (1, e)) 
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Nuevamente, simplifiquemos la GLC para comprenderla. Primero, se puede ver que los no 
terminales de la forma (1,*,0) son inútiles pues reducen siempre a otros del mismo tipo, de modo 
que nunca generarán una secuencia de terminales. Esto demuestra que las reglas en las líneas 8, 
11 y 13 pueden eliminarse. Similarmente, no hay forma de generar cadenas de terminales a partir 
de (0, #,0), lo que permite eliminar las reglas 5, 7 y 9. Podemos deshacernos de no terminales que 
reescriben de una única manera, reemplazándolos por su parte derecha. Llamando X = (0, #, 1) 
al único no terminal sobreviviente aparte de S tenemos la curiosa gramática: 

S —> e|aX 
X —> b | aXb 

la cual no es difícil identificar con la mucho más intuitiva S —> £ \ aSb. La asimetría que ha 
aparecido es consecuencia del tratamiento especial que recibe la b que comienza el desapilado en el 
AP del Ej. 3.9. 

El siguiente teorema fundamental de los lenguajes LC completa el círculo. 

Teorema 3.4 Todo lenguaje libre del contexto puede ser especificado por una GLC, o 
alternativamente, por un AP. 

Prueba: Inmediato a partir de los Teos. 3.2 y 3.3. □ 


3.6 Teorema de Bombeo [lpsi, sec 3 . 5 . 2 ] 

Nuevamente, presentaremos una forma de determinar que ciertos lenguajes no son LC. 
El mecanismo es similar al visto para lenguajes regulares (Sección 2.8), si bien el tipo de 
repetitividad que se produce en los lenguajes LC es ligeramente más complejo. 

Teorema 3.5 (Teorema de Bombeo) 

Sea L un lenguaje LC. Entonces existe un número N > 0 tal que toda cadena w £ L 
de largo |w| > N se puede escribir como w = xuyvz de modo que uv e, \uyv\ < N, y 
Vn > 0, xu n yv n z £ L. 

Prueba: Sea G = (V, E,i2, S) una GLC que genera L. Comenzaremos por mostrar que una 

cadena suficientemente larga necesita de un árbol de derivación suficientemente alto. Sea p = 
max{|z|, A —> z £ R} el largo máximo de la parte derecha de una regla. Entonces es fácil ver 
que un árbol de derivación de altura h (midiendo altura como la máxima cantidad de aristas desde 
la raíz hasta una hoja) no puede producir cadenas de largo superior a p h . Tomaremos entonces 
N = pÓ I, de modo que toda cadena de largo > N tiene un árbol de derivación de altura mayor que 
\V\. Lo fundamental es que esto significa que, en algún camino desde la raíz hasta una hoja, debe 
haber un no terminal repetido. Esto se debe a que, en cualquier camino del árbol de derivación, 
hay tantos nodos internos (rotulados por no terminales) como el largo del camino. 
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x u y v z 


Hemos asignado nombres a las partes de la cadena que deriva el árbol de acuerdo a la partición 
w = xuyvz que realizaremos. Obsérvese que, por ser el mecanismo de expansión de no terminales 
libre del contexto, cada vez que aparece A podríamos elegir expandirlo como queramos. En el 
ejemplo, la primera vez elegimos reglas que llevaron A =>* uyv y la segunda vez A =^* y. Pero 
podríamos haber elegido A ==>* y la primera vez. O podríamos haber elegido A ==>* uyv la 
segunda vez. En general podríamos haber generado S =>* xu n yv n z para cualquier n > 0. 



uyv 


Sólo queda aclarar que \uyv\ < N porque de otro modo se podría aplicar el argumento al 
subárbol cuya raíz es la A superior, para obtener un uyv más corto; y que uv A £ porque de 
otro modo podríamos repetir el argumento sobre xyz, la cual aún es suficientemente larga y por 
lo tanto debe tener un árbol suficientemente alto. Es decir, no puede ser posible eliminar todos 
los caminos suficientemente largos con este argumento y terminar teniendo un árbol muy pequeño 
para la cadena que deriva. □ 

Ejemplo 3.17 Usemos el Teorema de Bombeo para demostrar que L = { a n b n c n , n > 0} no es 
LC. Dado el N, elegimos vj = a N b N c N . Dentro de w el adversario puede elegir uyv como quiera, 
y en cualquiera de los casos la cadena deja de pertenecer a L si eliminamos u y v de w. 

Ejemplo 3.18 Otro ejemplo importante es mostrar que L = {ww,w € {a, b}*} no es LC. Para 
ello, tomemos w = a N b N a N b N € L. Debido a que \uyv\ < N, el adversario no puede elegir u 
dentro de la primera zona de a’s (o 6’s) y v dentro de la segunda. Cualquier otra elección hará que 
xyz A L. 
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3.7 Propiedades de Clausura [lpsi, sec 3.5.i y 3.5.2] 

Hemos visto que los lenguajes regulares se pueden operar de diversas formas y el resultado 
sigue siendo regular (Sección 2.7). Algunas de esas propiedades se mantienen en los lenguajes 
LC, pero otras no. 

Lema 3.2 La unión, concatenación y clausura de Kleene de lenguajes LC es LC. 

Prueba: Basta recordar las construcciones hechas para demostrar el Teo. 3.1. □ 

Lema 3.3 La intersección de dos lenguajes LC no necesariamente es LC. 

Prueba: Considérense los lenguajes L a b = { a n b n c m , n,m > 0} y L¿ c = {a m b n c n , n,m > 0}. 
Está claro que ambos son LC, pues L a h = { a n b n , n > 0} o c*, y L¡, c = a* o {b n c n , n > 0}. Sin 
embargo, L a f, n Lb c = {a n b n c n , n > 0}, el cual hemos visto en el Ej. 3.17 que no es LC. □ 

Lema 3.4 El complemento de un lenguaje LC no necesariamente es LC. 

Prueba: L\ n L 2 = U Lff, de manera que si el complemento de un lenguaje LC fuera siempre 
LC, entonces el Lema 3.3 sería falso. □ 

Observación 3.3 El que no siempre se puedan complementar los lenguajes LC nos dice 
que el hecho de que los APs sean no determinísticos no es superficial (como lo era el no 
determinismo de los AFNDs), sino un hecho que difícilmente se podrá eliminar. Esto 
tiene consecuencias importantes para el uso práctico de los APs, lo que se discutirá en 
las siguientes secciones. 

Observación 3.4 Es interesante que sí se puede intersectar un lenguaje LC con uno regular 
para obtener un lenguaje LC. Sea Mi = (Ad, E, T, Ai, si, Ai) el AP y M 2 = ( K 2 , E, S, s 2 , A 2 ) 
el AFD correspondientes. Entonces el AP M = (Ad x K 2 , E, T, A, (si, s 2 ), Ai x F 2 ), con 

A = {({p\,P2),x,a),((qi,q 2 ),l3)), ((pi,x, a), (qi, (3) G Ai, (p 2 , x) (q 2 , e)}, 

reconoce la intersección de los dos lenguajes. La idea es recordar en los estados de AL en 
qué estado están ambos autómatas simultáneamente. El problema para intersectar dos APs 
es que hacen cosas distintas con una misma pila, pero ese problema no se presenta aquí. 

El método descrito nos da también una forma de intersectar dos lenguajes regulares más 
directa que la vista en la Sección 2.7. 

3.8 Propiedades Algorítmicas [lpsi, sec 3.5.3] 

Veremos un par de preguntas sobre lenguajes LC que pueden responderse 
algorítmicamente. Las que faltan con respecto a los regulares no pueden responderse, pero 
esto se verá mucho más adelante. 
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Lema 3.5 Dado un lenguaje LC L y una cadena w, existe un algoritmo para determinar si 
w G L. 

Prueba: Lo natural parecería ser usar un AP, pero esto no es tan sencillo como parece: el AP 
no es determinístico y la cantidad de estados potenciales es infinita (considerando la pila). Aún 
peor, puede pasar mucho tiempo operando sólo en la pila sin consumir caracteres de la entrada. 
No es fácil determinar si alguna vez consumirá la cadena o no. Utilizaremos, en cambio, una GLC 
G = (V, E, R, S ) que genera L. La idea esencial es escribir todas las derivaciones posibles, hasta o 
bien generar w o bien determinar que w nunca será generada. Esto último es el problema. Para 
poder determinar cuándo detenernos, modificaremos G de modo que todas las producciones, o bien 
hagan crecer el largo de la cadena, o bien la dejen igual pero conviertan un no terminal en terminal. 
Si logramos esto, basta con probar todas las derivaciones de largo 2\w\. 

Debemos entonces eliminar dos tipos de reglas de G. 

1. Reglas de la forma A — e, pues reducen el largo de la cadena derivada. Para poder eliminar 
esta regla, buscaremos todas las producciones de la forma B —> xAy y agregaremos otra regla 
B — > xy a G, adelantándonos al posible uso de A —> e en una derivación. Cuando hayamos 
hecho esto con todas las reglas que mencionen A en la parte derecha, podemos descartar 
la regla A — s. Nótese que no es necesario reprocesar las nuevas reglas introducidas 
según viejas reglas A — e ya descartadas, pues la regla paralela correspondiente ya existe, 
pero sí deben considerarse para la regla que se está procesando en este momento. Lo que 
también merece atención es que pueden aparecer nuevas reglas de la forma B —> e, las 
cuales deben introducirse al conjunto de reglas a eliminar. Este proceso no puede continuar 
indefinidamente porque existen a lo más |V| reglas de este tipo. Incluso el conjunto de reglas 
nuevas que se introducirán está limitado por el hecho de que cada regla nueva tiene en su 
parte derecha una subsecuencia de alguna parte derecha original. Finalmente, nótese que si 
descartamos la regla S —> £ cambiaremos el lenguaje, pues esta regla permitirá generar la 
cadena vacía y no habrá otra forma de generarla. Esto no es problema: si aparece esta regla, 
entonces si w = e se responde w € L y se termina, de otro modo se puede descartar la regla 
S —> e ya que no es relevante para otras producciones. 

2. Reglas de la forma A — > B, pues no aumentan el largo de la cadena derivada y no convierten 
el no terminal en terminal. En este caso dibujamos el grafo dirigido de qué no terminales 
pueden convertirse en otros, de modo que A = B sii existe un camino de A a B en ese 
grafo. Para cada uno de estos caminos, tomamos todas las producciones de tipo C —> xAy 
y agregamos C —> xBy , adelantándonos al posible uso de esas flechas. Cuando hemos 
agregado todas las reglas nuevas, eliminamos en bloque todas las reglas de tipo A —> B. 
Nuevamente, no podemos eliminar directamente las reglas de tipo S —> A, pero éstas se 
aplicarán a lo sumo una vez, como primera regla, y para ello basta permitir derivaciones de 
un paso más. 

□ 


Lema 3.6 Dado un lenguaje LC L, existe un algoritmo para determinar si L = 0. 

Prueba: El punto tiene mucho que ver con la demostración del Teo. 3.5. Si la gramática G = 
(V,E, R, S) asociada a L genera alguna cadena, entonces puede generar una cadena sin repetir 
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símbolos no terminales en el camino de la raíz a una hoja del árbol de derivación (pues basta 
reemplazar el subárbol que cuelga de la primera ocurrencia por el que cuelga de la última, tantas 
veces como sea necesario, para quedarnos con un árbol que genera otra cadena y no repite símbolos 
no terminales). Por ello, basta con escribir todos los árboles de derivación de altura |Vj. Si para 
entonces no se ha generado una cadena, no se generará ninguna. □ 

3.9 Determinismo y Parsing [lpsi, sec 3.6] 

Las secciones anteriores levantan una pregunta práctica evidente: ¿cómo se puede parsear 
eficientemente un lenguaje? El hecho de que el no determinismo de los APs no sea superficial, 
y de que hayamos utilizado un método tan tortuoso e ineficiente para responder si w G L 
en el Lema 3.5, indican que parsear eficientemente un lenguaje LC no es algo tan inmediato 
como para un lenguaje regular. 

Lo primero es un resultado que indica que es posible parsear cualquier lenguaje LC en 
tiempo polinomial (a diferencia del método del Lema 3.5). 

Definición 3.16 La forma normal de Chomsky para GLCs establece que se permiten tres 
tipos de reglas: A — y BC, A — y a, y S — y e, donde A, B, C son no terminales, S es el 
símbolo inicial, y a es terminal. Para toda GLC que genere L, existe otra GLC en forma 
normal de Chomsky que genera L. 

Observación 3.5 Si tenemos una GLC en forma normal de Chomsky, es posible determinar 
en tiempo 0(\R\n 3 ) si una cadena w G L, donde n — \w\ y R son las reglas de la gramática. 
Esto se logra mediante programación dinámica, determinando para todo substring de w, 
Wj.Wi + i .. .Wj, qué no terminales A derivan ese substring, A =^* ugug+i... u^. Para 
determinar esto se prueba, para cada regla A — y BC, si existe un k tal que B ==^* v: t ... w k 

y C =>* W k+ 1 . ..Wj. 

Este resultado es interesante, pero aún no lo suficientemente práctico. Realmente 
necesitamos algoritmos de tiempo lineal para determinar si w G L. Esto sería factible si 
el AP que usamos fuera determinístico: en cualquier situación posible, este AP debe tener a 
lo sumo una transición a seguir. 

Definición 3.17 Dos reglas ((g, x, a), ( p , /?)) ^ ((g, x', a'), ( p ', /?')) de un AP colisionan si x 
es prefijo de x' (o viceversa) y a es prefijo de a' (o viceversa). 

Definición 3.18 Un AP M = (K, E, T, A, s, F) es determinístico si no existen dos reglas 
(( q,x,a),(p,/3 )) 7 ^ ((g, x 1 , ce'), (p 1 , /?')) G A que colisionan. 

Un AP no determinístico tiene un estado g del que parten dos transiciones, de modo que 
puede elegir cualquiera de las dos si en la entrada viene el prefijo común de a; y a/, y en el 
tope de la pila se puede leer el prefijo común de a y a 1 . No todo AP puede convertirse a 
determinístico. 
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Ejemplo 3.19 El lenguaje L = {a mi ba ni2 b... ba mk , k > 2, mi, mi ,..., mk > 0, m¿ A rn 3 para 
algún i, j} es LC pero no puede reconocerse por ningún AP determinístico. 

Un AP determinístico es el del Ej. 3.9, así como el de wcw R en el Ej. 3.10. El AP del 
ww R del mismo Ej. 3.9 no es determinístico, pues la transición ((0, £, e), (1,£)) colisiona con 
(( 0 , a, s), ( 0 , a)) y (( 0 , 6 ,e), ( 0 , 6 )). 

Lo que verdaderamente nos interesa es: ¿es posible diseñar un método para generar un AP 
determinístico a partir de una GLC? Ya sabemos que tal método no puede funcionar siempre, 
pero podemos aspirar a poderlo hacer en una buena cantidad de casos “interesantes”. 

Parsing Top-Down: Lenguajes LL (k) 

Volvamos a la conversión de GLC a AP del Teo. 3.2. La idea esencial es, dado que esperamos 
ver un cierto no terminal en la entrada, decidir de antemano qué regla aplicaremos para 
convertirlo en otra secuencia. El que debamos aplicar una regla entre varias puede introducir 
no determinismo. 

Tomemos el Ej. 3.14. El AP resultante no es determinístico, pues las transiciones 
((1, £, S), (1, £)) y ((1, £, S), (1, aSb)) colisionan. Sin embargo, no es difícil determinar cuál 
es la que deberíamos seguir en cada caso: si el próximo carácter de la entrada es una a, 
debemos reemplazar la S que esperamos ver por aSb, mientras que si es una b debemos 
reemplazarla por e. Esto sugiere la siguiente modificación del AP. 

Ejemplo 3.20 La siguiente es una versión determinística del AP del Ej. 3.14. 



El resultado es bastante distinto del que derivamos manualmente en el Ej. 3.9. 

El mecanismo general es agregar al estado final / del AP generado por el Teo. 3.2 los 
estados f c , ce E, junto con transiciones de ida ((/, c, e), ( f c , £)), y de vuelta ((/ c , e, c), (/, £)). 
Si dentro de cada estado f c podemos determinar la parte derecha que corresponde aplicar a 
cada no terminal que esté en el tope de la pila, habremos obtenido un AP determinístico. 
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Definición 3.19 Los lenguajes LC que se pueden reconocer con la construcción descrita 
arriba se llaman LL(1). Si se pueden reconocer mediante mirar de antemano los k caracteres 
de la entrada se llaman LL{k). 

Este tipo de parsing se llama “top-down” porque se puede visualizar como generando 
el árbol de derivación desde arriba hacia abajo, pues decidimos qué producción utilizar (es 
decir la raíz del árbol) antes de ver la cadena que se derivará. 

Esta técnica puede fracasar por razones superficiales, que se pueden corregir en la GLC 
de la que parte generándose el AP original. 

1. Factorización a la izquierda. Consideremos las reglas N — y D y N — y DN en la 
GLC del Ej. 3.5. Por más que veamos que lo que sigue en la entrada es un dígito, 
no tenemos forma de saber qué regla aplicar en un LL(1). Sin embargo, es muy fácil 
reemplazar estas reglas por N — y DN', N' — y e, N' —>■ N. En general si dos o más 
reglas comparten un prefijo común en su parte derecha, éste se puede factorizar. 

2. Recursión a la izquierda. Para cualquier k fijo, puede ser imposible saber qué regla 
aplicar entre E —* E + T y E —* T (basta que siga una cadena de T de largo mayor 
que k). Este problema también puede resolverse, mediante reemplazar las reglas por 
E — y TE', E' — y e, E' — y +TE'. En general, si tenemos reglas de la forma 
A — y Aai y otras A — y (3j, las podemos reemplazar por A — y ¡3jA', A 1 — y ai A', 
A' —y e. 


Ejemplo 3.21 Aplicando las técnicas descritas, la GLC del Ej. 3.5 se convierte en la siguiente, 
que puede parsearse con un AP determinístico que mira el siguiente carácter. 


E 

E’ 

E' 

T 

T' 

V 

F 

F 



N 

N' 

N' 



DN' 

N 

£ 


D 

D 

D 


0 


9 


Obsérvese que no es inmediato que el AP tipo LL(1) que obtengamos de esta GLC será 
determinístico. Lo que complica las cosas son las reglas como E' —y e. Tal como está, la idea es 
que, si tenemos E' en el tope de la pila y viene un + en la entrada, debemos reemplazar E' por 
+TE', mientras que si viene cualquier otra cosa, debemos eliminarla de la pila (o sea reemplazarla 
por e). En esta gramática esto funciona. Existe un método general para verificar que la GLC 
obtenida funciona, y se ve en cursos de compiladores: la idea es calcular qué caracteres pueden 
seguir a E' en una cadena del lenguaje; si + no puede seguirla, es seguro aplicar E' —y e cuando 
el siguiente carácter no sea +. 
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Algo interesante de estos parsers top-down es que permiten una implementación manual 
muy sencilla a partir de la GLC. Esto es lo que un programador hace intuitivamente cuando 
se enfrenta a un problema de parsing. A continuación haremos un ejemplo que sólo indica 
si la cadena pertenece al lenguaje o no, pero este parsing recursivo permite también realizar 
acciones de modo de por ejemplo evaluar la expresión o construir su árbol sintáctico. En un 
compilador, lo que hace el parsing es generar una representación intermedia del código para 
que después sea traducido al lenguaje de máquina. 

Ejemplo 3.22 Se puede obtener casi automáticamente un parser recursivo asociado a la GLC 
del Ej. 3.21. nextChar () devuelve el siguiente carácter de la entrada, y getChari) lo consume. 


ParseE 

if -i ParseT return false 
if -i ParseE' return false 
return true 


Parsei 7 ^ 

return ParselV 


ParseE' 

if nextChar () = + return ParseEj 
return ParseEg 


ParselV 

if -i ParseE return false 
if -i ParselV' return false 
return true 


ParseEj 

getChar (); 

if -i ParseT return false 
if -i ParseE' return false 
return true 

ParseEg 
return true 

... ParseT y ParseT' muy similares 
ParseE 

if nextChar () = ( return ParseEi 
return ParseE2 

ParseEi 

getChar(); 

if -i ParseE return false 
if nextChar () ^ ) return false 
getChar(); 
return true 


ParselV' 

if nextChar () € {0... 9} return ParselVj 
return ParselVj 

ParselVj 
return ParselV 

ParselV^ 

return true 

ParseE 

if nextCharQ = 0 return ParseEo 

if nextChar () = 9 return ParseEg 

ParseEo 
getCharf) 
return true 

... ParseEi a ParseEg similares 


Los procedimientos pueden simplificarse a mano significativamente, pero la intención es enfatizar 
cómo salen prácticamente en forma automática de la GLC. ParseE devolverá si pudo parsear 
la entrada o no, y consumirá lo que pudo parsear. Si devuelve true y consume la entrada 
correctamente, ésta es válida. Cada regla tiene su procedimiento asociado, y cada no terminal 
también. Por ejemplo ParseE' parsea un E', y recurre a dos reglas posibles, ParseEj y ParseEg. 
Para elegir, se considera el siguiente carácter. 
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Las suposiciones sobre la correctitud de la GLC para un parsing determinístico usando el 
siguiente carácter se han trasladado al código. Parse-E', por ejemplo, supone que se le puede 
dar la prioridad a ParseEj, pues verifica directamente el primer carácter, y si no funciona sigue con 
Pars eE' 2 . Esto no funcionaría si el + pudiera eventualmente aparecer siguiendo E' en la derivación. 


Parsing Bottom-Up: Lenguajes LR (k) 

El parsing top-down exige que, finalmente, seamos capaces de determinar qué regla aplicar 
a partir de ver el siguiente carácter (o los siguientes k caracteres). El parsing LR(/c) es más 
flexible. La idea esta vez es construir el árbol de parsing de abajo hacia arriba. 

La idea de este parsing es que la pila contiene lo que el parser ha visto de la entrada, 
no lo que espera ver. Lo que se ha visto se expresa como una secuencia de terminales y 
no terminales. En cada momento se puede elegir entre apilar la primera letra de la entrada 
(con lo que ya la “hemos visto”) o identificar la parte derecha de una regla en la pila y 
reemplazarla por la parte izquierda. Al final, si hemos visto toda la entrada y en la pila está 
el símbolo inicial, la cadena pertenece al lenguaje. 

Definición 3.20 El autómata de pila LR (APLR) de una GLC G = (V, E, R, S) se define 
como M = (K, E, T, A, s, F) donde K = {s, f}, T = V U E, F = {/} y 

A = {((s,e,S),(f,e))} 

U {((s, a, e), (s, a), a e E} 

U {((s, e, z R ), (s, A)), A — > z e R} 


Notar que el APLR es una alternativa a la construcción que hicimos en la Def. 3.13, 
más adecuada al parsing LR(k). Los generadores profesionales de parsers usan el mecanismo 
LR(fc), pues es más potente. 

Ejemplo 3.23 Dibujemos el APLR para la GLC del Ej. 3.14. Notar que no es determinístico. 


a, _,a 

b, _,b 



e,bSa,S 
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Nuevamente el APLR puede no ser determinístico, y se intenta detcrminizar considerando 
el siguiente carácter de la entrada. Surgen dos tipos de colisiones entre reglas (llamadas 
“conflictos”): shift/reduce cuando existe colisión entre una regla que indica apilar el siguiente 
símbolo de la entrada (shift) versus otra que indica transformar una parte derecha por 
una izquierda en la pila (reduce)] y reduce/reduce cuando hay dos formas de reducir partes 
derechas a izquierdas en la pila. 

Definición 3.21 Los lenguajes LC que se pueden reconocer con la construcción descrita 
arriba se llaman LR(k), donde k es la cantidad de caracteres que deben mirarse en la entrada 
para decidir los conflictos. 

Ejemplo 3.24 Tomemos la GLC del Ej. 3.5 y construyamos el APLR correspondiente: 

+,_J+ (>->( 

9Z9 

z,E, 


z,T+E,E e,)E(,F z,0,D 
z,T,E £,N,F 
e,F*T,T z,D,N e,9,D. 
e,F,T e,ND,N 

Sigamos un parsing exitoso de 2 + 3*5: 




(0, 2 + 3 * 5, e) b 
b 
b 
b 
b 


(0, +3 * 5, 2) b (0, +3 * 5, D) b (0,+3*5,lV) b (0,+3*5,F) 

(0, +3 * 5, T) b (0, +3 * 5, E) b (0,3*5,+£) b (0,*5,3 + £) 

(0, *5,11 + E) b (0, *5 , NE) b (0, *5, F + E) b (0, *5,T + _Ej 

(0, 5, *T + E) b (0, s, 5 * T + E) b (0, e, D * T + E) b (0, e, N * T + E) 

(0, e, F * T + E) b (0, e, T + E) b (0, e, E) b (l,e, e) 


El ejemplo muestra la relevancia de los conflictos. Por ejemplo, si en el segundo paso, en 
vez de reducir D — y 2 (aplicando la regla ((0, £, 2), (0, D))) hubiéramos apilado el +, nunca 
habríamos logrado reducir toda la cadena a E. Similarmente, en el paso 6, si hubiéramos 
apilado el + en vez de favorecer la regla E — y T, habríamos fracasado. En cambio, en el 
paso 13, debemos apilar * en vez de usar la regla E — y T. Esto indica que, por ejemplo, 
en el caso del conflicto shift/reduce de la regla ((0, +, e), (0, +)) con ((0, e, T), (0, E)) debe 
favorecerse el reduce, mientras que en el conflicto de ((0, *, e), (0, *)) con ((0, £, T), (0, E)) 
debe favorecerse el shift. Esto está relacionado con la precedencia de los operadores. El caso 
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de conflictos reduce/reduce suele resolverse priorizando la parte derecha más larga, lo cual 
casi siempre es lo correcto. Los generadores de parsers permiten indicar cómo resolver cada 
conflicto posible en la gramática, los cuales pueden ser precalculados. 


3.10 Ejercicios 

Gramáticas Libres del Contexto 

1 . Considere la gramática G = ({£, A}, {a, b}, R, S), con R = {S 
AAA, A —» a, A —» bA, A —» Ab}. 


AA,A 


(a) ¿Qué cadenas de C{G) se pueden generar con derivaciones de cuatro pasos o 
menos? 

(b) Dé al menos cuatro derivaciones distintas para babbab y dibuje los árboles de 
derivación correspondientes (los cuales podrían no ser distintos). 

2 . Sea la gramática G = ({S 1 , A}, {a, 6 }, R, S), con R = {S —* aAa, S — * bAb, S —> 
e,A-^SS}. 

(a) Dé una derivación para baabbb y dibuje el árbol de derivación. 

(b) Describa C(G) con palabras. 

3. Considere el alfabeto E = {a, 6 , (,), |,*, $}. Construya una GLC que genere todas las 
expresiones regulares válidas sobre {a,b}. 


4. Sea G = ({S 1 }, {a, b}, R, S), con R = {S — 
bSb, S —» e} Muestre que C(G) es regular. 

5. Construya GLCs para los siguientes lenguajes 

(a) {a m b n , m > n}. 

(b) { a m b n c p d q , m + n = p + q}. 

(c) { uawb , u,w G {a, b}*, |u| = |w|} 


aSa, S 


aSb, S —► bSa, S 


Autómatas de Pila 

1. Construya autómatas que reconozcan los lenguajes del ejercicio 5 de la sección anterior. 
Hágalo directamente, no transformando la gramática. 

2. Dado el autómata M = ({s, /}, {a, b}, {a}, A, s, {/}}, con 

A = {((s, a, e), (s, a)), ((s, 6 , e), ( s , a)), ((s, a, e), (/, e)), ((/, a, a), (/, e)), ((/, b, a), (/, e))}. 
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(a) Dé todas las posibles secuencias de transiciones para aba. 

(b) Muestre que aba,aa,abb £{M), pero baa,bab,baaaa G £(M). 

(c) Describa C(M) en palabras. 

3. Construya autómatas que reconozcan los siguientes lenguajes 

(a) El lenguaje generado por G = ({<S'} ) {[,],(,)}, R, S), con R = {S —* e,S —* 
SS,S —>[S],S 

(b) {a m b n , m < n < 2 m} 

(c) {w G {a,b}*, w = w R }. 

Gramáticas y Autómatas 

1. Considere la GLC G = ({S 1 , A, B}, {a, b}, R, S ), con R = {S —» abA, S —» B, S —> 
baB, S —* e, A —* bS, B —* aS, A —* b}. Construya el autómata asociado. 

2. Repita el ejercicio 1 de la parte anterior, esta vez obteniendo los autómatas 
directamente de la gramática. Compárelos. 

3. Considere nuevamente el ejercicio 1 de la parte anterior. Obtenga, usando el algoritmo 
visto, la gramática que corresponde a cada autómata que usted generó manualmente. 
Compárelas con las gramáticas originales de las que partió cuando hizo ese ejercicio. 

Lenguajes Libres de Contexto 

1. Use las propiedades de clausura (y otros ejercicios ya hechos) para probar que los 
siguientes lenguajes son LC. 

(a) {a m b n , m ^ n} 

(b) {a m b n c p d g , n = g V m < p V m + n = p + q} 

(c) {a' n b n c p , m — nV n — pV m — p} 

(d) {á' n b n c p , m^nVn^pVm^p} 

2. Use el Teorema de Bombeo para probar que los siguientes lenguajes no son LC. 

(a) {a p , p es primo }. 

(b) {a n \ n > 0}. 

(c) {www, w G {a, &}*}• 

(d) {a m b n c p , m = n A n = p A m = p} (¿lo reconoce?) 

3. Sean M x , M 2 autómatas de pila. Construya directamente autómatas para C(Mi) U 
£(M 2 ), C(M 1 )C(M 2 ) y 
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3.11 Preguntas de Controles 

A continuación se muestran algunos ejercicios de controles de años pasados, para dar una 
idea de lo que se puede esperar en los próximos. Hemos omitido (i) (casi) repeticiones, (ii) 
cosas que ahora no se ven, (ni) cosas qne ahora se dan como parte de la materia y/o están 
en los ejercicios anteriores. Por lo mismo a veces los ejercicios se han alterado un poco o se 
presenta sólo parte de ellos, o se mezclan versiones de ejercicios de distintos años para qne 
no sea repetitivo. 

C1 1996, 1997, 2005 Responda verdadero o falso y justifique brevemente (máximo 5 
líneas). Una respuesta sin justificación no vale nada aunque esté correcta, una respuesta 
incorrecta puede tener algún valor por la justificación. 

a) Un lenguaje regular también es LC, y además determinístico. 

b ) Los APs determinísticos no son más potentes que los autómatas finitos. Los que 
son más potentes son los no determinísticos. 

c) Si restringimos el tamaño máximo de la pila de los autómatas de pila a 100, éstos 
aun pueden reconocer ciertos lenguajes no regulares, como {a n b n , n < 100 }. 

d) Si un autómata de pila pudiera tener dos pilas en vez de una sería más poderoso. 

e) El complemento de un lenguaje LC no regular tampoco es regular. 

/) Si L es LC, L R también lo es. 

g ) Un autómata de pila puede determinar si un programa escrito en C será aceptado 
por el compilador (si no sabe C reemplácelo por Pascal, Turing o Java). 

h ) Todo subconjnnto de un lenguaje LC es LC. 

i) Los prefijos de un lenguaje LC forman un lenguaje LC. 

Hemos unido ejercicios similares de esos años. 

C1 1996 En la siguiente secuencia, si no logra hacer un ítem puede suponer qne lo ha 
resuelto y usar el resultado para los siguientes. 

a) Intente aplicar el Teorema de Bombeo sin la restricción \uyv\ < N para demostrar 
que el lenguaje {ww, w G {a,b}*} no es LC. ¿Por qué no funciona? 

d) ¿En qué falla el Teorema de Bombeo si quiere aplicarlo a {ww R , w G (a, 6 }*}? 
¿Es posible reforzar el Teorema para probar que ese conjunto no es LC? 

C1 1997 La historia de los movimientos de una cuenta corriente se puede ver como una 
secuencia de depósitos y extracciones, donde nunca hay saldo negativo. Considere que 
cada depósito es un entero entre 1 y A: (fijo) y cada extracción un entero entre —k y 
— 1. Se supone que la cuenta empieza con saldo cero. El lenguaje de los movimientos 
aceptables es entonces un subconjunto de {—k..k}*, donde nunca el saldo es negativo. 
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a) Dibuje un autómata de pila para este lenguaje. En beneficio suyo y pensando en 
la parte b), hágalo de un sólo estado. Descríbalo formalmente como una tupia. 

b) Transforme el autómata anterior a una GLC con el método visto, para el caso 
k — 1. ¿Qué problema se le presentaría para k > 1?. 

c) Modifique el autómata de modo que permita un sobregiro de n unidades pero al 
final el saldo no pueda ser negativo. 

Ex 1997 Sea M = (K, E, T, A, s, F) un autómata de pila. Se definió que el lenguaje 
aceptado por AL es £(M) = {te £ E*, (s,w,e) \~* M (f,e,e)} (donde / e F). 
Definimos ahora a partir de M otros dos lenguajes: £i (M) = {w G E*, ( s,w,e ) \~* M 
(/, e, a)} (donde / G F y a e T*), y C¿(AL) = {w <E E*, (s, w, e) \~* M (, q , e, e)} (donde 
q e K). 

a) Describa en palabras lo que significan C\ y £ 2 . 

b) Demuestre que todo autómata de pila AL se puede modificar (obteniendo un AL') 

de modo que £(M') = Ci(AL), y viceversa. 

c) Lo mismo que b) para £ 2 . 

C1 1998 Sea P un pasillo estrecho sin salida diseñado para ser raptados por extraterrestres. 
La gente entra al pasillo, permanece un cierto tiempo, y finalmente o bien es raptada 
por los extraterrestres o bien sale (desilusionada) por donde entró (note que el último 
que entra es el primero que sale, si es que sale). En cualquier momento pueden entrar 
nuevas personas o salir otras, pero se debe respetar el orden impuesto por el pasillo. 
Dada una cadena formada por una secuencia de entradas y salidas de personas, se desea 
determinar si es correcta o no. Las entradas se indican como E i, es decir el carácter E 
que indica la entrada y la i que identifica a la persona. Las salidas se indican como S j. 
En principio i y j deberían ser cadenas de caracteres, pero simplificaremos y diremos 
que son caracteres. Por ejemplo, E1E2E3S2E4S1 es correcta (3 y 4 fueron raptados), 
pero EIE2E3S2EAS3 es incorrecta (pues 2 entró antes que 3 y salió antes). 

a) Dibuje un autómata de pila que reconozca este lenguaje. 

b) Dé una GLC que genere este lenguaje. 

C2 1998 Use propiedades de clausura para demostrar que el siguiente lenguaje es LC 
L = {wiW 2 w 3 W 4 , ( vj-¿ = Wi V w 2 = wf) A \wiw 2 w 3 w 4 \ par} 

Ex 1998, C1 2003 Use el Teorema del Bombeo para probar que los siguientes lenguajes 
no son LC: 


a) L = {a n b m a n , m < n} 
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b) L = {a"b"'c r (T, O < n < m < r, O < s} 

C2 1999 Suponga que tiene una calculadora lógica que usa notación polaca (tipo HP). Es 
decir, primero se ingresan los dos operandos y luego la operación. Considerando los 
valores V y F y las operaciones + (or), * (and) y — (complemento), especifique un 
autómata de pila que reconoce una secuencia válida de operaciones y queda en un 
estado final si el último valor es V. 

Por ejemplo, para calcular (A orB) and C y los valores de A, B y C son V, F y V, 
respectivamente; usamos la secuencia VF + V*. 

C2 1999 Escoja una de las dos siguientes preguntas: 

a) Demuestre que el lenguaje L = { aNÁéd ?, i,j > 0} no es LC. 

b) Si L es LC y R es regular entonces ¿L — Re s LC? ¿Qué pasa con R — Ll Justifique 
su respuesta. 

Ex 1999 Escriba una GLC G que genere todas las posibles GLC sobre el alfabeto {a, b} 
y que usan los no terminales S, A, y B. Cada posible GLC es una secuencia de 
producciones separadas por comas, entre paréntesis y usando el símbolo igual para 
indicar una producción. Por ejemplo, una palabra generada por G es (S = ASB , A = 
a, B — b,S — e). Indique claramente cuales son los no terminales y terminales de G. 

C1 2000 (a) Un autómata de 2 pilas es similar a un autómata de pila, pero puede manejar 

dos pilas a la vez (es decir poner condiciones sobre ambas pilas y modificarlas 
simultáneamente). Muestre que con un autómata de 2 pilas puede reconocer el 
lenguaje a n b n c n . ¿Y a n b n c n d n l ¿Y a n b n c n d n e n 7 

(b) Se tiene una GLC G\ que define un lenguaje L i, y una expresión regular E 2 
que define un lenguaje L 2 . ¿Qué pasos seguiría para generar un autómata que 
reconozca las cadenas de L\ que no se puedan expresar como una cadena w\w , 
donde W\ y w 2 pertenecen a L 2 1 

C1 2001 Considere un proceso donde Pikachu intenta subir los pisos de un edificio, para 
lo cual recibe la energía necesaria en una cadena de entrada. La cadena contiene al 
comienzo una cierta cantidad de letras , tantas como pisos tiene el edificio. El resto 
de la cadena está formada por signos “E” y '”. Cada símbolo E en la entrada le da 
a Pikachu una unidad de energía, y cada tres unidades de energía Pikachu puede subir 
un piso más. Por otro lado, cada ” es un intervalo de tiempo sin recibir energía. Si 
pasan cuatro intervalos de tiempo sin recibir energía, Pikachu pierde una unidad E de 
energía. Si se recibe una E antes de pasar cuatro intervalos de tiempo de ”s, no se 
pierde nada (es decir, los últimos ”s se ignoran). Si recibe cuatro ”s cuando no 
tiene nada de energía almacenada, Pikachu muere. 
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Diseñe un autómata de pila que acepte las cadenas de la forma xy donde x = I n e 
y G {E, — }*, tal que y le da a Pikachu energía suficiente para subir un edificio de n 
pisos (puede sobrar energía). 

Ex 2002 Demuestre que para toda GLC G, existe una GLC G' en forma normal de Chomsky 
que genera el mismo lenguaje. 

C1 2004 Demuestre que si L es LC, entonces las cadenas de L cuyo largo no es múltiplo 
de 5 pero sí de 3, es LC. 

C1 2004 Se tiene la siguiente GLC: E —» E A E \ E V E \ (E) | 0 | 1. 

1. Utilice el método básico para obtener un autómata de pila que reconozca C(E). 

2. Repita el procedimiento, esta vez utilizando el método visto para parsing bottorn- 
up. 

3. Modifique la GLC y/o alguno de los APs para obtener un autómata de pila 
determinístico. El “A” tiene mayor precedencia que el “V”. 

C1 2005 Para cada uno de los siguientes lenguajes, demuestre que o bien es regular, o bien 
LC y no regular, o bien no es LC. 

1 . {a n b m , n < m < 2 n} 

2. {w G {a, b}*, w tiene el doble de a’s que Es } 

3. {a pn+q , n > 0}, para cualquier p, q > 0. 

4. {a n UV (n+m) , m, n > 0}. 

C1 2006 Demuestre que los siguientes lenguajes son libres del contexto. 

1. L — {ww R , w G L'}, donde L 1 es un lenguaje regular. 

2. f = {wG {a, b}*, w ^ w R } (w R es w leído al revés). 

C1 2008 Dé una gramática libre del contexto y un autómata de pila para el lenguaje de 
cadenas sobre el alfabeto E = {+,—}, tal que el número de —s hasta cualquier posición 
de la cadena no exceda al de +s en más de 3 unidades. 

C1 2008 Un transductor de pila (TP) es parecido a un AP, excepto que en las transiciones 
también puede escribir caracteres en una secuencia de salida. Diremos que el TP 
transforma una cadena w en una u si acepta w y en el proceso escribe u (al ser no 
determinísticos, podría transformar w en varias cosas distintas). Definimos el lenguaje 
generado por un TP como el conjunto de cadenas que puede escribir frente a cualquier 
entrada. 
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1. Defina formalmente un TP, y todo lo necesario para describir formalmente que 
transforma w en u, y el lenguaje generado. 

2. Demuestre que el lenguaje generado por un TP es libre del contexto. 

3.12 Proyectos 

1. Investigue sobre la relación entre GLCs y las DTDs utilizadas en XML. 

2. Investigue más sobre detcrminismo y parsing, lenguajes LL(k) y LR(k). Hay algo 
de material en el mismo capítulo indicado del libro, pero mucho más en un libro de 
compiladores, como [ASU86, cap 4] o [AU72, cap 5]. En estos libros puede encontrar 
material sobre otras formas de parsing. 

3. Investigue sobre herramientas para generar parsers automáticamente. En C/Unix se 
llaman lex y yace, pero existen para otros sistemas operativos y lenguajes. Construya 
un parser de algún lenguaje de programación pequeño y luego conviértalo en intérprete. 

4. Programe el ciclo de conversión GLC —y AP —> GLC. 

5. Programe la conversión a Forma Normal de Chomsky y el parser de tiempo 0(n 3 ) 
asociado. Esto se ve, por ejemplo, en [HMU01 sec 7.4], 
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Capítulo 4 


Máquinas de Turing y la Tesis de 
Church 

[LP81, cap 4 y 5] 

La computabilidad se puede estudiar usando diversos formalismos, todos ellos 
equivalentes. En este curso nos hemos decidido por las Máquinas de Turing por dos razones: 
(i) se parecen a los autómatas de distinto tipo que venimos viendo de antes, (ii) son el 
modelo canónico para estudiar NP-completitud, que es el último capítulo del curso. 

En este capítulo nos centraremos solamente en el formalismo, y cómo utilizarlo y 
extenderlo para distintos propósitos, y en el siguiente lo utilizaremos para obtener los 
resultados de computabilidad. Recomendamos al lector el uso de un simulador de 
MTs (que usa la notación modular descrita en la Sección 4.3) que permite dibujarlas 
y hacerlas funcionar. Se llama Java Turing Visual (JTV) y está disponible en 
http://www.dcc.uchile.cl/jtv. 1 

Al final del capítulo intentaremos convencer al lector de la Tesis de Church, que dice 
que las Máquinas de Turing son equivalentes a cualquier modelo de computación factible de 
construir. Asimismo, veremos las gramáticas dependientes del contexto, que extienden las 
GLCs, para completar nuestro esquema de reconocedores/generadores de lenguajes. 


4.1 La Máquina de Turing (MT) [lpsi, sec 4 . 1 ] 

La Máquina de Turing es un mecanismo de computación notoriamente primitivo, y sin 
embargo (como se verá más adelante) permite llevar a cabo cualquier cómputo que podamos 
hacer en nuestro PC. Informalmente, una MT opera con un cabezal dispuesto sobre una cinta 
que tiene comienzo pero no tiene fin, extendiéndose hacia la derecha tanto como se quiera. 

1 Esta herramienta se desarrolló en el DCC, por mi alumno Marco Mora Godoy, en su Memoria de 
Ingeniería. Si se la usa debe tenerse en cuenta que no es del todo estable, y a veces puede borrar los archivos 
que ha grabado. Funciona mejor con jdk 1.4. 
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Cada celda de la cinta almacena un carácter, y cuando se examina un carácter de la cinta 
nunca visto, se supone que éste contiene un blanco fifi). Como los autómatas, la MT está en 
un estado , de un conjunto finito de posibilidades. En cada paso, la MT lee el carácter que 
tiene bajo el cabezal y, según ese carácter y el estado en que está, pasa a un nuevo estado 
y lleva a cabo una acción sobre la cinta: cambiar el carácter que leyó por uno nuevo (en la 
misma celda donde tiene el cabezal), o mover el cabezal hacia la izquierda o hacia la derecha. 

Como puede escribir la cinta, la MT no tendrá estados finales o no finales, pues puede 
dejar escrita la respuesta (sí o no) al detenerse. Existe simplemente un estado especial, 
denominado h, al llegar al cual la computación de la MT se detiene. La computación 
también se interrumpe (sin llegar al estado h) si la MT trata de moverse hacia la izquierda 
de la primera celda de la cinta. En tal caso decimos que la MT se “cuelga”, pero no que se 
detiene o que la computación termina. 

Tal como con autómatas, dibujaremos las MTs como gratos donde los nodos son los 
estados y las transiciones están rotuladas. Una transición de p a q rotulada a, b significa que 
si la MT está en el estado p y hay una letra a bajo el cabezal, entonces pasa al estado q y 
realiza la acción b. La acción de escribir una letra a € E se denota simplemente a. La de 
moverse a la izquierda o derecha se denota < y D>, respectivamente. La acción de escribir 
un blanco fifi) se llama también borrar la celda. 

Ejemplo 4.1 Dibujemos una MT que, una vez arrancada, borre todas las a’s que hay desde el 
cabezal hacia atrás, hasta encontrar otro fi. El alfabeto es {a, fi}. 



Notar que si se arranca esta MT con una cinta que tenga puras a’s desde el comienzo de la 
cinta hasta el cabezal, la máquina se colgará. Notar también que no decimos qué hacer si estamos 
en el estado 1 y no leemos fi. Formalmente siempre debemos decir qué hacer en cada estado ante 
cada carácter (como con un AFD), pero nos permitiremos no dibujar los casos imposibles, como 
el que hemos omitido. Finalmente, véase que la transición fi, fi es una forma de no hacer nada al 
pasar a h. 

Definamos formalmente una MT y su operación. 

Definición 4.1 Una Máquina de Tnring (MT) es una tupia AL = (K,U,ó,s), donde 
• K es un conjunto finito de estados, h <jL K. 
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• E es un alfabeto finito, | £ E, 

• s G K es el estado inicial 

• 5 : K x E —y (K U {ú}) x (ELI {<, >}), <3, > ^ E, es la función de transición. 

Ejemplo 4.2 La MT del Ej. 4.1 se escribe formalmente como M = ( K,T,,5,s ) con K = {0,1} , 
£ = {a,#}, s = 0, y 


s 

0 

1 

a 

1,# 

l,a 

# 


0,< 


Notar que hemos debido completar de alguna forma la celda <5(1, a) = (l,a), que nunca puede 
aplicarse dada la forma de la MT. Véase que, en un caso así, la MT funcionaría eternamente sin 
detenerse (ni colgarse). 

Definamos ahora lo que es una configuración. La información que necesitamos para poder 
completar una computación de una MT es: su estado actual, el contenido de la cinta, y la 
posición del cabezal. Los dos últimos elementos se expresan particionando la cinta en tres 
partes: la cadena que precede al cabezal (e si estamos al inicio de la cinta), el carácter sobre 
el que está el cabezal, y la cadena a la derecha del cabezal. Como ésta es infinita, esta cadena 
se indica sólo hasta la última posición distinta de fif. Se fuerza en la definición, por tanto, a 
que esta cadena no pueda terminar en fi. 

Definición 4.2 Una configuración de una MT AI = (K, E, S, s) es un elemento de Cm = 
(K U {/r}) x E* x E x (E* — (E* o {#})). Una configuración ( q,u,a,v ) se escribirá también 
( q,uav ) , e incluso simplemente uav cuando el estado es irrelevante. Una configuración de 
la forma ( h , u, a, v) se llama configuración detenida. 

El funcionamiento de la MT se describe mediante cómo nos lleva de una configuración a 
otra. 

Definición 4.3 La relación lleva en un paso para una MT AI = (K , E, 5, s), La/C Cm x Cm, 
se define como: ( q,u,a,v ) \~m (q', u', a', v') si q G K, 5(q,a) = (q',b), y 

1. Si b e E (la acción es escribir el carácter b en la cinta), entonces v! — u, v' — v, 
a' = b. 

2. Si b = < (la acción es moverse a la izquierda), entonces u'a' = u y (i) si av ff, 
entonces v' = av, de otro modo v' = e. 

3. Si b = > (la acción es moverse a la derecha), entonces v! = ua y (i) siv^fie entonces 
a'v' = v, de otro modo a'v' = ff. 
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Observación 4.1 Nótese lo que ocurre si la MT quiere moverse hacia la izquierda estando 
en la primera celda de la cinta: la ecuación vía! = u = e no puede satisfacerse y la 
configuración no lleva a ninguna otra, pese a no ser una configuración detenida. Entonces 
la computación no avanza, pero no ha terminado (está “colgada”). 

Como siempre, diremos b en vez de \~m cuando M sea evidente, y b* ( bj ^) será la clausura 
reflexiva y transitiva de b (b m), “lleva en cero o más pasos”. 

Definición 4.4 Una computación de M de n pasos es una secuencia de configuraciones 
Cq b M C\ b M . . . b M C n . 

Ejemplo 4.3 Mostremos las configuraciones por las que pasa la MT del Ej. 4.1 al ser arrancada 
desde la configuración ffaaaar. 

(0, #aaaa) b (1 ,ffaaaffi) b (0, #aaa) b (1 ,ffaaff) b (0, ffaa) 
b (l,#a#) b (0,#a) b (1,##) b (0,#) b 

a partir de la cual ya no habrá más pasos porque es una configuración detenida. En cambio, si la 
arrancamos sobre aaa la MT se colgará: 

(0, aaaf) b (1 ,aaff) b (0 ,aa) b (1 ,aff) b (0,a) b 

y de aquí ya no se moverá a otra configuración. 


4.2 Protocolos para Usar MTs [lpsi, sec 4 . 2 ] 

Puede verse que las MTs son mecanismos mucho más versátiles que los autómatas que 
hemos visto antes, que no tenían otro propósito posible que leer una cadena de principio a 
fin y terminar o no en un estado final (con pila vacía o no). Una MT transforma el contenido 
de la cinta, por lo que puede utilizarse, por ejemplo, para calcular funciones de cadenas en 
cadenas. 

Definición 4.5 Sea f : EjJ —» EJ, donde ff qL E 0 U E^ Decimos que una MT AI = 
(. K , E, S, s) computa / si 

\/vj E Eq, (s,#w#)h* M (h,#f(w)#). 

La definición se extiende al caso de funciones de múltiples argumentos, f(wi, w 2 ,..., wfi), 
donde la MT debe operar de la siguiente forma: 


(s, #uq#w 2 # • • • #«T#) h* M (h, #f(w u w 2 , • • •, w k )#). 

Una función para la cual existe una MT que la computa se dice Turing-computable o 
simplemente computable. 
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Esto nos indica el protocolo con el cual esperamos usar una MT para calcular funciones: 
el dominio e imagen de la función no permiten el carácter ff, ya que éste se usa para delimitar 
el argumento y la respuesta. El cabezal empieza y termina al final de la cadena, dejando 
limpio el resto de la cinta. 

Observación 4.2 Una observación muy importante sobre la Def. 4-5 es que M no se cuelga 
frente a ninguna entrada, sino que siempre llega a h. Esto significa que jamás intenta 
moverse hacia la izquierda del primer #. Por lo tanto, si sabemos que M calcula f , podemos 
con confianza aplicarla sobre una cinta de la forma ffxffyffwff V saber que terminará y 
dejará la cinta en la forma ffxffyfff{w)ff sin alterar x o y. 

Ejemplo 4.4 Una MT que calcula f{w) = w (es decir, cambiar las a’s por b’s y viceversa en 
w € {a, b}*), es la que sigue: 

a ,<I 



Nótese que no se especifica qué hacer si, al ser arrancada, el cabezal está sobre un carácter 
distinto de jf, ni en general qué ocurre si la cinta no sigue el protocolo establecido, pues ello no 
afecta el hecho de que esta MT calcule / según la definición. 

Ejemplo 4.5 Una MT que calcula f(w) = ww R (donde w R es w escrita al revés), es la que sigue. 



Es un ejercicio interesante derivar f(iu) = ww a partir de este ejemplo. 
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Es posible también usar este formalismo para computar funciones de números naturales, 
mediante representar n con la cadena I n (lo que es casi notación unaria). 

Definición 4.6 Sea f : N —* N. Decimos que una MT AI computa f si AI computa (según 
la Def. 4-5) g : {/}* —* {/}* dada por g(I n ) = I^ n \ La definición se extiende similarmente 
a funciones de varias variables y se puede hablar de funciones Turing-computables entre los 
números naturales. 

Ejemplo 4.6 Las MTs que siguen calculan /(n) = n + 1 (izquierda) y f(n,m) = n + m (derecha). 


i,< /,> 



Verifiqúese que la MT de la suma funciona también para los casos f(n, 0) (cinta #/”##) y 
/(0, m) (cinta ##/ m #). 


Hemos visto cómo calcular funciones usando MTs. Volvamos ahora al plan original de 
utilizarlas para reconocer lenguajes. Reconocer un lenguaje es, esencialmente, responder “sí” 
o “no” frente a una cadena, dependiendo que esté o no en el lenguaje. 

Definición 4.7 Una MT decide un lenguaje L si calcula la función : E* —* {S, N}, 
definida como Íl{w) = S 44 w G L (y si no, Íl{w) = Nj. Si existe tal MT, decimos que L es 
Turing-decidióle o simplemente decidióle. 

Notar que la definición anterior es un caso particular de calcular funciones donde Eo = E 
y Ei = {S, N} (pero fp sólo retornará cadenas de largo 1 de ese alfabeto). 

Existe una noción más débil que la de decidir un lenguaje, que será esencial en el 
próximo capítulo. Imaginemos que nos piden que determinemos si una cierta proposición es 
demostrable a partir de un cierto conjunto de axiomas. Podemos probar, disciplinadamente, 
todas las demostraciones de largo creciente. Si la proposición es demostrable, algún día 
daremos con su demostración, pero si no... nunca lo podremos saber. Sí, podríamos 
tratar de demostrar su negación en paralelo, pero en todo sistema de axiomas suficientemente potente 
existen proposiciones indemostrables tanto como su negación, recordar por ejemplo la hipótesis del continuo 
(Obs. 1.3). 

Definición 4.8 Una MT M = (K, E, S, s) acepta un lenguaje L si se detiene exactamente 
frente a las cadenas de L, es decir (s,ffwff) \~* M ( h,uav) 44 w G L. Si existe tal MT, 
decimos que L es Turing-aceptable o simplemente aceptable. 

Observación 4.3 Es fácil ver que todo lenguaje decidible es aceptable, pero la inversa no 
se ve tan simple. Esto es el tema central del próximo capítulo. 
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4.3 Notación Modular [lpsi, sec 4.3 y 4 . 4 ] 

No llegaremos muy lejos si insistimos en usar la notación aparatosa de MTs vista hasta 
ahora. Necesitaremos MTs mucho más potentes para enfrentar el próximo capítulo (y para 
convencernos de que una MT es equivalente a un computador!). En esta sección definiremos 
una notación para MTs que permite expresarlas en forma mucho más sucinta y, lo que es 
muy importante, poder componer MTs para formar otras. 

En la notación modular de MTs una MT se verá como un grafo, donde los nodos serán 
acciones y las aristas condiciones. En cada nodo se podrá escribir una secuencia de acciones, 
que se ejecutan al llegar al nodo. Luego de ejecutarlas, se consideran las aristas que salen 
del nodo. Estas son, en principio, flechas rotuladas con símbolos de E. Si la flecha que sale 
del nodo está rotulada con la letra que coincide con la que tenemos bajo el cabezal luego de 
ejecutar el nodo, entonces seguimos la flecha y llegamos a otro nodo. Nunca debe haber más 
de una flecha aplicable a cada nodo (hasta que lleguemos a la Sección 4.5). Permitiremos 
rotular las flechas con conjuntos de caracteres. Habrá un nodo inicial, donde la MT comienza 
a operar, y cuando de un nodo no haya otro nodo adonde ir, la MT se detendrá. 

Las acciones son realmente MTs. Comenzaremos con 2 + |E| acciones básicas , que 
corresponden a las acciones que pueden escribirse en ó, y luego podremos usar cualquier 
MT que definamos como acción para componer otras. 

Definición 4.9 Las acciones básicas de la notación modular de MTs son: 

• Moverse hacia la izquierda (<): Esta es una MT que, pase lo que pase, se mueve hacia 
la izquierda una casilla y se detiene. <1 = ({s}, E, ó, s), donde Va G E, <5(s, a) = ( h , <l). 
(Notar que estamos sobrecargando el símbolo <\, pero no debería haber confusión.) 

• Moverse hacia la derecha (>): Esta es una MT que, pase lo que pase, se mueve hacia 
la derecha una casilla y se detiene. > = ({s}, E, ó, s), donde Va G E, ó(s, a) = ( h , >). 

• Escribir el símbolo 6 G E (b): Esta es una MT que, pase lo que pase, escribe b en la 
cinta y se detiene, b = ({s},E,5, s), donde Va G E, 5(s,a ) = (h, b). Nuevamente, 
estamos sobrecargando el símbolo b G E para denotar una MT. 


Observación 4.4 Deberíamos definir formalmente este mecanismo y demostrar que es 
equivalente a las MTs. No lo haremos porque es bastante evidente que lo es, su definición 
formal es aparatosa, y finalmente podríamos vivir sin este formalismo, cuyo único objetivo 
es simplificarnos la vida. Se puede ver en el libro la demostración. 

Dos MTs sumamente útiles como acciones son <U y que se mueven hacia la izquierda 
o derecha, respectivamente, hasta encontrar en la cinta un símbolo de A C E. Otra es B , 
que borra la cadena que tiene hacia la izquierda (hasta el blanco). 
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Definición 4.10 Las máquinas <U, >a y B se definen según el siguiente diagrama: 


B = ><l 

La máquina <U, por ejemplo, comienza moviéndose a la izquierda. Luego, si el carácter 
sobre el que está parada no está en A, vuelve a moverse, y así. Si, en cierto momento, queda 
sobre un carácter de A, entonces luego de ejecutar el nodo no tiene flecha aplicable que 
seguir, y se detiene. 

Nótese que <U y primero se mueven , y luego empiezan a verificar la condición. Es 
decir, si se arrancan paradas sobre una letra de A, no la verán. Cuando A = {a} escribiremos 

y 

Nótese también la forma de escribir cualquier conjunto en las flechas. También pudimos 
escribir a ^ A, por ejemplo. Si A = {a} podríamos haber escrito a a. Cuando les demos 
nombre a los caracteres en las transiciones utilizaremos letras griegas para no confundirnos 
con las letras de la cinta. 

El dar nombre a la letra que está bajo el cabezal se usa para algo mucho más poderoso 
que expresar condiciones. Nos permitiremos usar ese nombre en el nodo destino de la flecha. 
Ejemplificaremos esto en la siguiente máquina. 

Definición 4.11 La máquina shift left ( ( S' < ) se define de según el siguiente diagrama (parte 
izquierda). 


S < = > < # >-- <1 o-- > > < # 


La máquina S < ¡ comienza buscando el hacia la izquierda (nótese que hemos ya utilizado 
una máquina no básica como acción). Luego se mueve hacia la derecha una celda. La flecha 
que sale de este nodo se puede seguir siempre, pues no estamos realmente poniendo una 
condición sino llamando a a la letra sobre la que estamos parados. En el nodo destino, la 
MT se mueve a la izquierda, escribe la a y, si no está parada sobre el #, se mueve a la 
derecha y vuelve al nodo original. Más precisamente, vuelve a la acción de moverse a la 
derecha de ese nodo. Nótese que nos permitimos flechas que llegan a la mitad de un nodo, y 
ejecutan las acciones del nodo de ahí hacia adelante. Esto no es raro ya que un nodo de tres 
acciones ABC se puede descomponer en tres nodos A —>■ B —>• C. Vale la pena recalcar que 
las dos ocurrencias de cr en el dibujo indican cosas diferentes. La primera denota una letra 
de la cinta, la segunda una acción. 

No existe magia en utilizar variables en esta forma. A la derecha de la Def. 4.11 mostramos 
una versión alternativa sobre el alfabeto E = {a, b, c, #}. La variable realmente actúa como 
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una macro, y no afecta el modelo de MTs porque el conjunto de valores que puede tomar 
siempre es finito. Es interesante que este mecanismo, además, nos independiza del alfabeto, 
pues la definición de S < se expandiría en máquinas distintas según E. En realidad, lo mismo 
ocurre con las máquinas básicas. 

La máquina S^, entonces, está pensada para ser arrancada en una configuración tipo 
(s, Xffwff) (donde w no contiene blancos), y termina en la configuración (h,Xwff). Es 
decir, toma su argumento y lo mueve una casilla a la izquierda. Esto no cae dentro del 
formalismo de calcular funciones, pues S < puede no retornar un ff al comienzo de la cinta. 
Más bien es una máquina auxiliar para ser usada como acción. La forma de especificar lo 
que hacen estas máquinas será indicar de qué configuración de la cinta llevan a qué otra 
configuración, sin indicar el estado. Es decir, diremos S <i : ffwff —* wff. Nuevamente, 
como S < no se cuelga haciendo esto, está claro que si hubiera una X antes del primer blanco, 
ésta quedaría inalterada. 

Existe una máquina similar que mueve w hacia la derecha. Se invita al lector a dibujarla. 
No olvide dejar el cabezal al final al terminar. 

Definición 4.12 La máquina “shift right” opera de la siguiente forma. S t> : ffwff —* 
##«>#• 

Repetiremos ahora el Ej. 4.5 para mostrar cómo se simplifica dibujar MTs con la notación 
modular. 


Ejemplo 4.7 La MT del Ej. 4.5 se puede dibujar en la notación modular de la siguiente forma. 
El dibujo no sólo es mucho más simple y fácil de entender, sino que es independiente de E. 


* a ^ 

<1-- # a < # a 


# 




Ejemplo 4.8 Otra máquina interesante es la copiadora, C : ffwff — > jfwjfwjf. Se invita 
al lector a dibujarla, inspirándose en la que calcula f(w) = ww R del Ej. 4.7. Con esta máquina 
podemos componer fácilmente una que calcule f(w ) = ww: C S<¡. Claro que esta no es la máquina 
más eficiente para calcular / (o sea, que lo logre en menos pasos), pero hasta el Capítulo 6 la 
eficiencia no será un tema del que preocuparnos. Ya tendremos bastantes problemas con lo que se puede 
calcular y lo que no. 

Es interesante qne la MT que suma dos números, en el Ej. 4.6, ahora puede escribirse 
simplemente como S < ¡. La qne incrementa un número es I >. Con la notación modular nos 
podemos atrever a implementar operaciones aritméticas más complejas. 
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Ejemplo 4.9 Una MT que implementa la función diferencia entre números naturales (dando cero 
cuando la diferencia es negativa) puede ser como sigue. 



> >#B 


La MT M que implementa la multiplicación puede ser como sigue. En el ciclo principal vamos 
construyendo ffl n ffl m ffl n ' m mediante ir reduciendo I n e ir agregando una copia de I m al final 
de la cinta. Cuando I n desaparece, pasamos a otro ciclo que borra I m para que quede solamente 



El siguiente ejemplo es importante porque demuestra que existen lenguajes decidibles 
que no son libres del contexto. 

Ejemplo 4.10 La siguiente MT decide el lenguaje {a n b n c n , n > 0}. 



>N> 


Ejemplo 4.11 La siguiente máquina, que llamaremos E. recibe entradas de la forma ffuffvff y 
se detiene sii u = v. La usaremos más adelante. 



4.4. MTS DE K CINTAS Y OTRAS EXTENSIONES 


85 


E = 


< 

# 


O* # 


# < 


< - 
G 


# > A 


< 


# 



Observación 4.5 El uso de variables para denotar nombres de letras no está exento de 
problemas. Imaginemos que haya dos formas de llegar a un nodo, una de ellas asignando 
a y la otra no. En este caso, si intentáramos expandir la “macro”, tendríamos problemas. 
Simplemente el dibujo no representaría una MT. Peor aún: una flecha rotulada a que partiera 
de ese nodo se podría interpretar de distinta forma según vengamos de un nodo donde a se 
asigne (en cuyo caso la flecha está diciendo que la letra debe ser igual al valor ya fijado de 
a), o de otro donde no (en cuyo caso la flecha no pone una condición sobre la letra sino que 
la llama a). Este tipo de ambigüedades debe evitarse, bajo la responsabilidad de quien dibuja 
la máquina. Nuevamente recordamos que este mecanismo no es parte de nuestro formalismo 
real sino que es una forma abreviada de dibujar las MTs. Es nuestra responsabilidad usarlo 
correctamente. 


4.4 MTs de k Cintas y Otras Extensiones [lpsi, sec 4 . 5 ] 

Es posible extender el mecanismo de la MT sin alterar lo que se puede hacer con la MT 
básica. Esto simplifica mucho dibujar MTs que realicen ciertas tareas, con la seguridad de 
que podríamos hacerlo con MTs básicas de ser necesario. Algunas de estas extensiones son: 
MTs que usan varias cintas, MTs con varios cabezales, MTs con cinta infinita hacia ambos 
lados, MTs con cinta fc-dimensional, etc. De todos esos mecanismos, el más útil es la MT 
con k cintas, a la cual nos dedicaremos en esta sección. Otras extensiones se pueden ver en 
el libro. 

Una MT de k cintas tiene un cabezal en cada cinta. En cada paso, lee simultáneamente 
los k caracteres bajo los cabezales, y toma una decisión basada en la /c-upla. Esta consiste 
de pasar a un nuevo estado y realizar una acción en cada cinta. 

Definición 4.13 Una MT de k cintas es una tupia M = (K,E,S,S) tal que K, E y s son 
como en la Def. 4-1 V ó : K x E k —» (K U { h }) x (E U {<, >}) k . 

Definición 4.14 Una configuración de una MT de k cintas M = (. K , E, 5, s ) es un elemento 
de C M = (K U {h}) x (E* x E x (E* — (E* o {#}))) fc . Una configuración se escribirá 
(q, uiaiVi,u 2 a 2 V 2 , • • •, u k OkV k ). 

Definición 4.15 La relación lleva en un paso para una MT de k cintas M = 
(K,E,S,s), b M C Cm x Cm, se define como: (q, u\a\V\, 1 * 202 ^ 2 , • • •, u k a k v k ) h 
(<?', u\a\v\,u' 2 afy ' 2l ..., u' k a' k v' k ) si q G K, ó(q, ai, a 2i ■ ■ ■, a k ) = (</, 61 , 62 , - - -, b k ), y las reglas 
de la Def. 4-3 se cumplen para cada UíOíVí, ula'^ y 
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Definamos ahora cómo usaremos una MT de k cintas. 

Definición 4.16 Una MT de k cintas arranca con una configuración de la forma ffwff en 
la cinta 1, y todas las otras cintas en la configuración fi. Cuando se detiene, la configuración 
de la cinta 1 es la salida, mientras que los contenidos de las otras cintas se ignoran. 

La forma en que usaremos una MT de k cintas en la notación modular es algo distinta. 
En principio parece ser menos potente pero es fácil ver que no es así. En cada acción y cada 
condición, pondremos un supraíndice de la forma W indicando en qué cinta se realiza cada 
acción o al carácter de qué cinta nos referimos en cada condición. Se puede poner condiciones 
sobre distintas cintas a la vez, como 

El siguiente ejemplo muestra cómo se simplifican algunos problemas si se pueden utilizar 
varias cintas. La MT misma no es mucho más chica, pero su operatoria es mucho más sencilla 
de entender. 

Ejemplo 4.12 Una MT M que implementa la multiplicación (como en el Ej. 4.9), ahora usando 
3 cintas, puede ser como sigue. Ahora I n e I m se dejan en las cintas 2 y 3, respectivamente, y el 
resultado se construye en la cinta 1. 



Veamos ahora cómo simular una MT de k cintas con una de 1 cinta, para convencernos 
de que podemos usar MTs de k cintas de ahora en adelante y saber que, de ser necesario, la 
podríamos convertir a una tradicional. 

La forma en la que simularemos una MT de k cintas consiste en “particionar” la (única) 
cinta de la MT simuladora (que es una MT normal de una cinta) en 2k “pistas”. Cada cinta 
de la MT simulada se representará con 2 pistas en la cinta simuladora. En la primera pista 
pondremos el contenido de la cinta, y en la segunda marcaremos la posición del cabezal: 
esa pista tendrá todos O’s, excepto un 1 donde está el cabezal. Formalmente, esta cinta 
particionada se expresa teniendo símbolos de (E x {0, l}) fc en el alfabeto. También debemos 
tener los símbolos originales (E) porque la simulación empieza y termina con el contenido 
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de la cinta 1. Y tendremos un símbolo adicional $ ^ E para marcar el comienzo de la cinta 
simuladora. 

Por ejemplo, si la MT simulada tiene las cintas en la configuración 



entonces la MT simuladora estará en la siguiente configuración 


$ 

a 

b 

b 

a 

a 

# 

a 

# 

# 

# 

# 

# 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

# 

c 

c 

c 

c 

# 

# 

# 

# 

# 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

# 

a 

# 

a 

# 

a 

# 

a 

# 

a 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 


Notemos que los símbolos grandes son el $ y el # verdadero. Cada columna de símbolos 
pequeños es en realidad un único carácter de (S x {0, l}) fc . El cabezal de la simuladora estará 
siempre al final de la cinta particionada. Para simular un solo paso de la MT simulada en 
su estado q, la MT simuladora realizará el siguiente procedimiento: 

1. Buscará el 1 en la pista 2, para saber dónde está el cabezal de la cinta 1 simulada. 

2. Leerá el símbolo en la pista 1 y lo recordará. ¿Cómo lo recordará? Continuando por 
una MT distinta para cada símbolo a G E que pueda leer. Llamemos oy a este símbolo. 

3. Buscará el 1 en la pista 4, para saber dónde está el cabezal de la cinta 2 simulada. 

4. Leerá el símbolo en la pista 3 y lo recordará en < 72 . 

5. Observará el valor de S(q, ai,, a k ) = (</, b\,..., b k ). ¿Cómo? Realmente hay una 
rutina de éstas para cada q de la MT simulada. La parte de lectura de los caracteres 
es igual en todas, pero ahora difieren en qué hacen frente a cada tupia de caracteres. 
Asimismo, para cada una de las |E| fc posibles tupias leídas, las acciones a ejecutar serán 
distintas. 

6. Buscará nuevamente el 1 en la pista 2, para saber dónde está el cabezal de la cinta 1 
simulada. 







CAPITULO 4. MAQUINAS DE TURING Y LA TESIS DE CHURCH 


7. Ejecutará la acción correspondiente a la cinta 1. Si es <3 (>), moverá el 1 de la pista 
2 hacia la izquierda (derecha). Si es escribir 6 6 S, reemplazará la letra de la pista 1 
por b. 

8 . Buscará nuevamente el 1 en la pista 4, para saber dónde está el cabezal de la cinta 2 
simulada. 

9. Ejecutará la acción correspondiente a la cinta 2. 


10. Transferirá el control al módulo que simula un paso cuando la MT simulada está en el 
estado q'. 


Más formalmente, sea M = (Jí, E, ó, s ) la MT de k cintas simulada. Entonces tendremos 
un módulo F q para cada q G K. (Los * significan cualquier carácter, es una forma de describir 
un conjunto finito de caracteres de (E x {0, l}) fc .) 


F < = 


(c¡ |, 1 .*,*,*,*) 


(*,!,*,*,*,*) 




(*,*,a 2 ,l,* *) 


(*.*,*,l.V) 


>#< 


,<M) 


M) 


>mD, 


# ^q,a t ,a 2 .c¡ 3 


Estos módulos F q terminan en módulos de la forma A qjCíl ^ ak (notar que, una vez 
expandidas las rnacros en el dibujo anterior, hay \T,\ k de estos módulos D al final, uno para 
cada posible tupia leída). Lo que hace exactamente cada módulo D depende precisamente 
de S(q, ai, ..., aQ. Por ejemplo, si S(q, ai, a, 2 , 0,3) = ( q' , < 3 , O, 6), b G E, entonces A q ^ ai ^ a2 ^ a3 = 
1 1 D' 2 ILys —> F q t. Estas acciones individuales mueven el cabezal hacia la izquierda (/) o 
derecha (D) en la pista indicada, o escriben b (W). 


h 






(a v 0,a 2 ,p 2 ,a 3 ,p } ) , , , , , 

<| -- (C7 1> l,C7 2 ,^,0 3 ,p,) [>. 

$ 


<1 


n _ (o 1 ,fl,o 2 ,l J o 3 , ft ) (O 1>ñ ^ 2> 0j(T 3 , ft ) 

U 2 - / <I -- «*P A.°2 > -- ^vPv a 2 d> a 3-ft) P# 


(#,0,#,1,#,0) > 


w „ (o v p l ,a 2 ,p 2 ,a 3 ,1 ) 

W b,3 - > <I (V> , Vjl) -- (®i. A.®2 .ft. b P 


Observar, en particular, que si la MT simulada se cuelga (intenta moverse al $), la 
simuladora se cuelga también (podríamos haber hecho otra cosa). Si, en cambio, la acción 
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Ai se para sobre un #, significa que está tratando de acceder una parte de la cinta que aún 
no hemos particionado, por lo que es el momento de hacerlo. 

Hemos ya descrito la parte más importante de la simulación. Lo que nos queda es más 
sencillo: debemos particionar la cinta antes de comenzar, y debemos “des-particionar” la 
cinta luego de terminar. Lo primero se hace al comenzar y antes de transferir el control a F s , 
mientras que lo último se hace en la máquina correspondiente a Fh (que es especial, distinta 
de todas las otras F q , q G K). 

Para particionar la cinta, simplemente ejecutamos 


> S > <#< $ > ~ (a,o#,o# ,0)—I 

! # 

(#,i# ,o# ,o)>-- f s 

Finalmente, sigue la máquina des-particionadora F h . No es complicada, aunque es un 
poco más enredada de lo que podría ser pues, además del contenido, queremos asegurar de 
dejar el cabezal de la MT real en la posición en que la MT simulada lo tenía en la cinta 1. 


(O 0 * * * *) 

< 1 $ > 1 ’ * ~<G> 

' (0,1,*,*,*,*) 


t (O o * * * *j 

Oo#,o&>|> l <ia’> 

# 

^ 

V 9 9 9 9 / 


Lema 4.1 Sea una MT de k cintas tal que, arrancada en la configuración fifrw#, 
w £ (S — {#})*, (1) se detiene en la configuración (q, u\aiVi, U 2 CI 2 V 2 , ■ ■ ■, UkQ'kVk), (2) se 
cuelga, (3) nunca termina. Entonces se puede construir una MT de una cinta que, arrancada 
en la configuración (1) se detiene en la configuración UiüiVi, (2) se cuelga, (3) nunca 

termina. 

Prueba: Basta aplicar la simulación que acabamos de ver sobre la MT de k cintas. □ 
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4.5 MTs no Determinísticas (MTNDs) [lpsi, sec 4 . 6 ] 

Una extensión de las MTs qne resultará particularmente importante en el Capítulo 6, 
y que además nos simplificará la vida en varias ocasiones, son las MT no determinísticas 
(MTNDs). Estas resultan ser equivalentes a las MT tradicionales (determinísticas, que 
ahora también llamaremos MTD). Una MTND puede, estando en un cierto estado y viendo 
un cierto carácter bajo el cabezal, tener cero, una, o más transiciones aplicables, y puede 
elegir cualquiera de ellas. Si no tiene transiciones aplicables, se cuelga (en el sentido de que 
no pasa a otra configuración, a pesar de no estar en la configuración detenida). 

En la notación modular, tendremos cero o más flechas aplicables a partir de un cierto 
nodo. Si no hay flechas aplicables, la MTND se detiene (notar la diferencia con la notación 
tradicional de estados y transiciones). Si hay al menos una flecha aplicable, la MTND debe 
elegir alguna, no puede elegir detenerse si puede no hacerlo. Si se desea explicitar que una 
alternativa válida es detenerse, debe agregarse una flecha hacia un nodo que no haga nada 
y no tenga salidas. 

Definición 4.17 Una Máquina de Turing no Determimstica (MTND) es una tupia M = 
(K, E, A, s), donde K, E y s son como en la Def. 4-1 V A C (. K x E) x (( K U { h }) x (E U 
{<,>})). 

Las configuraciones de una MTND y la relación b son idénticas a las de las MTDs. Ahora, 
a partir de una cierta configuración, la MTND puede llevar a más de una configuración. 
Según esta definición, la MTND se detiene frente a una cierta entrada sii existe una secuencia 
de elecciones que la llevan a la configuración detenida, es decir, si tiene forma de detenerse. 

Observación 4.6 No es conveniente usar MTNDs para calcular funciones, pues pueden 
entregar varias respuestas a una misma entrada. En principio las utilizaremos solamente 
para aceptar lenguajes, es decir, para ver si se detienen o no frente a una cierta entrada. En 
varios casos, sin embargo, las usaremos como submáquinas y nos interesará lo que puedan 
dejar en la cinta. 

Las MTNDs son sumamente útiles cuando hay que resolver un problema mediante probar 
todas las alternativas de solución. Permiten reemplazar el mecanismo tedioso de ir generando 
las opciones una por una, sin que se nos escape ninguna, por un mecanismo mucho más simple 
de “adivinar” (generar no determinísticamente) una única opción y probarla. 

Ejemplo 4.13 Hagamos una MT que acepte el lenguaje de los números compuestos, {I n , 3p, q > 
2 ,n = p ■ q}. (Realmente este lenguaje es decidióle, pero aceptarlo ilustra muy bien la idea.) Lo 
que haríamos con una MTD (y con nuestro lenguaje de programación favorito) sería generar, uno 
a uno, todos los posibles divisores de n, desde 2 hasta y/ñ, y probarlos. Si encontramos un divisor, 
n es compuesto, sino es primo. Pero con una MTND es mucho más sencillo. La siguiente MTND 
genera, no determinísticamente, una cantidad de /’s mayor o igual a 2. 
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G = > >I>I— i 

I 

> 

Ahora, una MTND que acepta los números compuestos es GGME, donde G es la MTND de 
arriba, M es la multiplicadora (Ej. 4.9) y E es la MT que se detiene sii recibe dos cadenas iguales 
(Ej. 4.11). 

Es bueno detenerse a reflexionar sobre esta MTND. Primero aplica G dos veces, con lo que 
la cinta queda de la forma para algún par p, q > 2. Al aplicar M, la cinta queda 

de la forma #I n #I pq #. Al aplicar E, ésta se detendrá sólo si n = pq. Esto significa que la 
inmensa mayoría (infinitas!) de las alternativas que produce GG llevan a correr E para siempre sin 
detenerse. Sin embargo, si n es compuesto, existe al menos una elección que llevará E a detenerse 
y la MTND aceptará n. 


Ejemplo 4.14 Otro ejemplo útil es usar una MTND para buscar una secuencia dada en la cinta, 
como abaa. Una MTD debe considerar cada posición de comienzo posible, compararla con abaa, y 
volver a la siguiente posición de comienzo. Esto no es demasiado complicado, pero más simple es 
la siguiente MTND, que naturalmente se detiene en cada ocurrencia posible de abaa en w, si se la 
arranca en #w. 



Los ejemplos anteriores nos llevan a preguntarnos cómo se pueden probar todas las 
alternativas de p y q, si son infinitas. Para comprender esto, y para la simulación de MTNDs 
con MTDs, es conveniente pensar de la siguiente forma. Una MTD produce una secuencia 
de configuraciones a lo largo del tiempo. Si las dibujamos verticalmente, tendremos una 
línea. Una MTND puede, en cada paso, generar más de una configuración. Si las dibujamos 
verticalmente, con el tiempo fluyendo hacia abajo, tenemos un árbol. En el instante t, el 
conjunto de configuraciones posibles está indicado por todos los nodos de profundidad t en 
ese árbol. 

Por ejemplo, aquí vemos una ejecución (detcrminística) de la MT sumadora (Ej. 4.6) a 
la izquierda, y una ejecución (no determinística) de G (Ej. 4.13) a la derecha. Se ve cómo G 
puede generar cualquier número: demora más tiempo en generar números más largos, pero 
todo número puede ser generado si se espera lo suficiente. 
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De hecho una visualización esquemática de la ejecución de GGME (Ej. 4.13) con la 
entrada J 6 es como sigue. 
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Hemos señalado con flechas gruesas los únicos casos (2 x 3 y 3 x 2) donde la 
ejecución termina. Nuevamente, a medida que va pasando más tiempo se van produciendo 
combinaciones mayores de p, q. 

La simulación de una MTND M con una MTD se basa en la idea del árbol. Recorreremos 
todos los nodos del árbol hasta encontrar uno donde la MTND se detenga (llegue al estado 
h), o lo recorreremos para siempre si no existe tal nodo. De este modo la MTD simuladora 
se detendrá sii la MTND simulada se detiene. Como se trata de un árbol infinito, hay que 
recorrerlo por niveles para asegurarse de que, si existe un nodo con configuración detenida, 
lo encontraremos. 

Nótese que la aridad de este árbol es a lo sumo r = (\K\ + 1) • (|E| + 2), pues ése es el 
total de estados y acciones distintos que pueden derivarse de una misma configuración. Por 
un rato supondremos que todos los nodos del árbol tienen aridad r, y luego resolveremos el 
caso general. 

La MTD simuladora usará tres cintas: 

1. En la primera cinta mantendremos la configuración actual del nodo que estamos 
simulando. La tendremos precedida por una marca $, necesaria para poder limpiar 
la cinta al probar un nuevo nodo del árbol. 

2. En la segunda guardaremos una copia de la entrada intacta. 

3. En la tercera almacenaremos una secuencia de dígitos en base r (o sea símbolos sobre 
di, d 2 , • •., d r ), llamados directivas. Esta secuencia indica el camino desde la raíz hasta 
el nodo actual. Por ejemplo si se llega al nodo bajando por el tercer hijo de la raíz, luego 
por el primer hijo del hijo, y luego por el segundo hijo del nieto de la raíz, entonces 
el contenido de la cinta será ^c^chc^#- El nodo raíz corresponde a la cadena vacía. 
Cuando estemos simulando el h-ésimo paso para llegar al nodo actual, estaremos sobre 
el fc-ésimo dígito en la secuencia. 

Lo primero que hace la MTD simuladora es copiar la cinta 1 en la 2, poner la marca 
inicial $ en la cinta 1, y borrarla. Luego entra en el siguiente ciclo general: 

1. Limpiará la cinta 1 y copiará la cinta 2 en la cinta 1 (máquina Prep). 

2. Ejecutará la MTND en la cinta 1, siguiendo los pasos indicados en las directivas de la 
cinta 3 (máquina M'). 

3. Si la MTND no se ha detenido, pasará al siguiente nodo de la cinta 3 (máquina Inc ) y 
volverá al paso 1. 

Finalmente, eliminará el $ de la cinta 1 y se asegurará de dejar el cabezal donde la MTND 
simulada lo tenía al detenerse. 

La MTD simuladora es entonces como sigue. El ciclo se detiene si, luego de ejecutar M ', 
en la cinta de las directivas no estamos parados sobre el # final que sigue a las directivas. 
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Esto significa que M' se detuvo antes de leerlas todas. O sea, M' se detuvo porque llegó 
a h y no porque se le acabaron las directivas. En realidad pueden haber pasado ambas cosas a la 
vez, en cuyo caso no nos daremos cuenta de que M' terminó justo a tiempo. Pero no es problema, nos 
daremos cuenta cuando tratemos de ejecutar un nodo que descienda del actual, en el siguiente nivel. Para 
la burocracia final necesitamos otra marca @. Para comprender del todo cómo funciona esta 
burocracia final es bueno leer primero cómo funciona Prep (especialmente el primer punto, 
pues aquí se hace lo mismo). 


r 


<C$ (1 W 2) ** & <2) # (1) 

# u> 


r 


Prep M’——~Inc 


#< 3) c 


o) 


1 \ j/<3) 






t(l) 


# <@ G 


La máquina Prep realiza las siguientes acciones: 


1. Se mueve hacia la derecha en la cinta 1 todo lo necesario para asegurarse de estar más 
a la derecha que cualquier cosa escrita. Como, en la cinta 3, hemos pasado por una 
directriz di por cada paso de M simulado, y AL no puede moverse más de una casilla a 
la derecha por cada paso, y la simulación de AL comenzó con el cabezal al final de su 
configuración, basta con moverse en la cinta 1 hacia la derecha mientras se mueve a la 
izquierda en la cinta 3, hasta llegar al primer # de la cinta 3. Luego vuelve borrando 
en la cinta 1 hasta el $. 

2 . Se mueve una casilla hacia adelante en la cinta 3, quedando sobre la primera directiva 
a seguir en la ejecución del nodo que viene. 

3. Copia la cinta 2 a la cinta 1, quedando en la configuración inicial 
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La máquina Inc comienza al final de las directivas en la cinta 3 y simula el cálculo del 
sucesor en un número en base r: Si r = 3, el sucesor de d\d\ es d\d 2 , luego d 3 d 3 , luego d 2 di, 
y así hasta d 3 d 3 , cuyo sucesor es didid 3 . Por ello va hacia atrás convirtiendo d r en d 3 hasta 
que encuentra un di ^ d r , el cual cambia por d i+3 (no hay suma real aquí, hemos abreviado 
para no poner cada i separadamente). Si llega al comienzo, es porque eran todos d r , y es 
hora de pasar al siguiente nivel del árbol. 



Finalmente, la máquina M' es la MTD que realmente simula la MTND M, evitando el 
no determinismo mediante las directivas de la cinta 3. M' tiene los mismos estados y casi las 
mismas transiciones que M. Cada vez que M tiene r salidas desde un estado por un cierto 
carácter (izquierda), M' le cambia los rótulos a esas transiciones, considerando las 3 cintas 
en las que actúa (derecha): 
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Nótese que M' es determinística, pues no existen dos transiciones que salen de ningún 
q por las mismas letras (ahora tripletas). Se sabe qne siempre está sobre ff en la cinta 2. 
Ahora elige pasar al estado q t ejecutando la acción b t (en la cinta 1) siempre qne la directiva 
actual indique En la cinta 3, pasa a la siguiente directiva. Además, si se acabaron las 
directivas, se detiene para dar paso a la simulación del siguiente nodo del árbol. Otro detalle 
es que, si la MTND se cuelga, lo detectamos porque la simuladora queda sobre el $ en la 
cinta 1. En ese caso hacemos como si la MTND hubiera usado todas las instrucciones sin 
terminar, de modo de dar lugar a otros nodos del árbol. 

Si en cualquier estado q frente a cualquier carácter a hubiera menos de r alternativas 
distintas, lo más simple es crear las alternativas restantes, que hagan lo mismo que algunas 
que ya existen. Si no hubiera ninguna alternativa la MTND se colgaría, por lo que deberíamos 
agregar una rutina similar a la que hicimos para el caso en que toque $ en la cinta 1. 

Lema 4.2 Todo lenguaje aceptado por una MTND es aceptado por una MTD. 

Prueba: Basta producir la MTD que simula la MTND según lo visto recién y correrla sobre la 
misma entrada. (Esta MTD es a su vez una MT de 3 cintas que debe ser simulada por una MT de 
una cinta, según lo visto en el Lema 4.1.) □ 

4.6 La Máquina Universal de Turing (MUT) [lpsi, sec 5.7] 

El principio fundamental de los computadores de propósito general es que no se cablea 
un computador para cada problema que se desea resolver, sino que se cablea un único 
computador capaz de interpretar programas escritos en algún lenguaje. Ese lenguaje tiene su 
propio modelo de funcionamiento y el computador simula lo que haría ese programa en una 
cierta entrada. Tanto el programa como la entrada conviven en la memoria. El programa 
tiene su propio alfabeto (caracteres ASCII, por ejemplo) y manipula elementos de un cierto 
tipo de datos (incluyendo por ejemplo números enteros), los que el computador codificae n su 
propio lenguaje (bits), en el cual también queda expresada la salida que después el usuario 
interpretará en términos de los tipos de datos de su lenguaje de programación. El computador 
debe tener, en su propio cableado, suficiente poder para simular cualquier programa escrito 
en ese lenguaje de programación, por ejemplo no podría simular un programa en Java si no 
tuviera una instrucción Goto o similar. 

Resultará sumamente útil para el Capítulo 5 tener un modelo similar para MTs. En 
particular, elegimos las MTs como nuestro modelo de máquina “cableada” y a la vez como 
nuestro modelo de lenguaje de programación. La Máquina Universal de Turing (MUT) 
recibirá dos entradas: una MT M y una entrada w, codificadas de alguna forma, y simulará 
el funcionamiento de AL sobre w. La simulación se detendrá, se colgará, o correrá para 
siempre según AL lo haga con w. En caso de terminar, dejará en la cinta la codificación de 
lo que M dejaría en la cinta frente a w. 

¿Por qué necesitamos codificar? Si vamos a representar toda MT posible, existen MTs 
con alfabeto E (finito) de tamaño n para todo n , por lo cual el alfabeto de nuestra MT 
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debería ser infinito. El mismo problema se presenta en un computador para representar 
cualquier número natural, por ejemplo. La solución es similar: codificar cada símbolo del 
alfabeto como una secuencia de símbolos sobre un alfabeto finito. Lo mismo pasa con la 
codificación de los estados de M. 

Para poder hacer esta codificación impondremos una condición a la MT M, la cual 
obviamente no es restrictiva. 

Definición 4.18 Una MT M = (K,E,S,s) es codificable si K = {gx, q 2 ,..., q\ k\} y 
E = {#, a 2 , • • •, a|E|}. Definimos también = {q 1 , q 2 ,. ..}, E^ = {#, a 2 ,...}. 
Consideraremos a\ = ff. 

Es obvio que para toda MT M' existe una MT AL codificable similar, en el sentido de que 
lleva de la misma configuración a la misma configuración una vez que mapeamos los estados 
y el alfabeto. 

Definiremos ahora la codificación que usaremos para MTs codificables. Usaremos una 
función auxiliar A para denotar estados, símbolos y acciones. 

Definición 4.19 La función A : U {h} U U {<, >} —* I* se define como sigue: 


X 

\(x) 

h 

I 

di 

p +1 

<1 

I 

> 

II 

# 

III 

cii 

ji +2 


Nótese que A puede asignar el mismo símbolo a un estado y a un carácter, pero no 
daremos lugar a confusión. 

Para codificar una MT esencialmente codificaremos su estado inicial y todas las celdas 
de 5. Una celda se codificará de la siguiente forma. 

Definición 4.20 Sea <5(g¿, a,-) = (</, b) una entrada de una MT codificable. Entonces 

Síj = c A (qf) c A (a,j) c Á(q') c A (b) c 


Con esto ya podemos definir cómo se codifican MTs y cintas. Notar que el nombre de 
función p está sobrecargado. 
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Definición 4.21 La función p convierte una MT codificable AI = (. K , E, ó, s ) en una 
secuencia sobre {c, I}*, de la siguiente forma: 

P(M) = C X(s) C Sip ■ ■ ■ *S'l,|S| S2 ,1 ■ ■ ■ <S2,|E| . . . >S'|A'|,l <S'|.K'|,2 • • • <S'|ft'|,|E| c 


Definición 4.22 La función p convierte una w G en una secuencia sobre {c, I}*, de la 
siguiente forma: 

p(w ) = c A(iüi) c A(w 2 ) c ... c A(iü| m |) c 

Notar que p{e) = c. 

Finalmente, estamos en condiciones de definir la MUT. 

Definición 4.23 La Máquina Universal de Turing (MUT), arrancada en una configuración 
( s MUT,ff z p(M)p(w)ff ), donde smut es su estado inicial, AI = (K,E,ó,s) es una MT 
codificable, y todo G E — {#}, hace lo siguiente: 

1. Si, arrancada en la configuración (s,ffwff), AI se detiene en una configuración 
( h,uav ), entonces la MUT se detiene en la configuración (h,ffp(u)X(a)p(v)), con el 
cabezal en la primera c de p(v). 

2. Si, arrancada en la configuración (s,ffwff), M no se detiene nunca, la MUT no se 
detiene nunca. 

3. Si, arrancada en la configuración (s,ffwff), AI se cuelga, la MUT se cuelga. 

Veamos ahora cómo construir la MUT. Haremos una construcción de 3 cintas, ya que 
sabemos que ésta se puede traducir a una cinta: 

1. En la cinta 1 tendremos la representación de la cinta simulada (inicialmente pfifiwff)) 
y el cabezal estará en la c que sigue a la representación del carácter donde está el 
cabezal representado. Inicialmente, la configuración es ffp[fif , w)\[fif)c. 

2. En la cinta 2 tendremos siempre ffp(AI)ff y no la modificaremos. 

3. En la cinta 3 tendremos #A(<?)#, donde q es el estado en que está la máquina simulada. 

El primer paso de la simulación es, entonces, pasar de la configuración 
inicial (ffp(M)p(w)#,#,#), a la apropiada para comenzar la simulación: 
(p(ffw)X(ff)c,ffp(M)ff,ffX(s)ff) (A(s) se obtiene del comienzo de p(M) y en realidad 
se puede eliminar de p(M) al moverlo a la cinta 2). Esto no conlleva ninguna dificultad. 
(Nótese que se puede saber dónde empieza p(w) porque es el único lugar de la cinta con tres 
c’s seguidas.) 

Luego de esto, la MLIT entra en un ciclo de la siguiente forma: 
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1. Verificamos si la cinta 3 es igual a #/#, en cuyo caso se detiene (pues / = X(h) indica 
que la MT simulada se ha detenido). Recordemos que en una simulación de k cintas, 
la cinta 1 es la que se entrega al terminar. Esta es justamente la cinta donde tenemos 
codificada la cinta que dejó la MT simulada. 

2. Si la cinta 3 es igual a pR'p Y en I a cinta 1 alrededor del cabezal tenemos ... cPc ..., 
entonces se busca en la cinta 2 el patrón ccPcPc. Notar que esta entrada debe estar si 
nos dieron una representación correcta de una MT y una w con el alfabeto adecuado. 

3. Una vez que encontramos ese patrón, examinamos lo que le sigue. Digamos que es de 
la forma I r cl s c. Entonces reescribimos la cinta 3 para que diga pl r p, y: 

(a) Si s — 1 debemos movernos a la izquierda en la cinta simulada. Ejecutamos «de 1 "*- 
Si la c sobre la que quedamos no está precedida de un blanco #, terminamos 
ese paso. Si sí, la MT simulada se ha colgado y debemos colgarnos también 
(<(b desde ese #), aunque podríamos hacer otra cosa. En cualquier caso, al 
movernos debemos asegurarnos de no dejar A {4f)c al final de la cinta, por la regla 
de que las configuraciones no deberían terminar en Así, antes de movernos 
a la izquierda debemos verificar que la cinta que nos rodea no es de la forma 
... cA(#)c# ... = ... c///c# .... Si lo es, debemos borrar el A (#)c final antes 
que nada. 

(b) Si s = 2, debemos movernos a la derecha en la cinta simulada. Ejecutamos 

Si quedamos sobre una c, terminamos de simular este paso. Si quedamos sobre un 
blanco #, la MT simulada se ha movido a la derecha a una celda nunca explorada. 
En este caso, escribimos A(#)c = lile a partir del # y quedamos parados sobre 
la c final. 

(c) Si s > 2, debemos modificar el símbolo bajo el cabezal de la cinta simulada. 
Es decir, el entorno alrededor del cabezal en la cinta 1 es .. .cPc... y debemos 
convertirlo en ... cPc.... Esto no es difícil pero es un poco trabajoso, ya que 
involucra hacer o eliminar espacio para el nuevo símbolo, que tiene otro largo. 
No es difícil crear un espacio con la secuencia de acciones # S t> c < />, o 
borrarlo con la secuencia <# > # ># S < <¡# c. 

4. Volvemos al paso 1. 

La descripción demuestra que la MUT realmente no es excesivamente compleja. De 
hecho, escribirla explícitamente es un buen ejercicio para demostrar maestría en el manejo 
de MTs, y simularla en .JTV puede ser entretenido. 
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4.7 La Tesis de Church [lpsi, sec 5.1} 

Al principio de este capítulo se explicaron las razones para preferir las MTs como 
mecanismo para estudiar computabilidad. Es hora de dar soporte a la correctitud de esta 
decisión. 

¿Qué debería significar que algo es o no “computablc”, para que lo que podamos 
demostrar sobre computabilidad sea relevante para nosotros? Quisiéramos que la definición 
capture los procedimientos que pueden ser realizados en forma mecánica y sistemática, con 
una cantidad finita (pero ilimitada) de recursos (tiempo, memoria). 

¿Qué tipo de objetos quisiéramos manejar? Está claro que cadenas sobre alfabetos finitos 
o numerables, o números enteros o racionales son realistas, porque existe una representación 
finita para ellos. No estaría tan bien el permitirnos representar cualquier número real, 
pues no tienen una representación finita (no alcanzan las secuencias finitas de símbolos 
en ningún alfabeto para representarlos, recordar el Teo. 1.2). Si los conjuntos de cardinal 
fifi se permitieran, podríamos también permitir programas infinitos, que podrían reconocer 
cualquier lenguaje o resolver cualquier problema mediante un código que considerara las 
infinitas entradas posibles una a una: 

if w = abbab then return S 

if w = bbabbabbbabbabbbb then return S 

if w = bb then return N 

if w = bbabbbaba then return S 


lo cual no es ni interesante ni realista, al menos con la tecnología conocida. 

¿Qué tipo de acciones quisiéramos permitir sobre los datos? Está claro que los autómatas 
finitos o de pila son mecanismos insatisfactorios, pues no pueden reconocer lenguajes que 
se pueden reconocer fácilmente en nuestro PC. Las MTs nos han permitido resolver todo lo 
que se nos ha ocurrido hasta ahora, pero pronto veremos cosas que no se pueden hacer. 
Por lo tanto, es válido preguntarse si un límite de las MTs debe tomarse en serio, o 
más generalmente, cuál es un modelo válido de computación en el mundo real. Esta es 
una pregunta difícil de responder sin sesgarnos a lo que conocemos. ¿Serán aceptables 
la computación cuántica (¿se podrá finalmente implementar de verdad?), la computación 
biológica (al menos ocurre en la realidad), la computación con cristales (se ha dicho que la 
forma de cristalizarse de algunas estructuras al pasar al estado sólido resuelve problemas 
considerados no computables)? ¿No se descubrirá mañana un mecanismo hoy impensable 
de computación? 

La discusión debería convencer al lector de que el tema es debatible y además que no se 
puede demostrar algo, pues estamos hablando del mundo real y no de objetos abstractos. 
Nos deberemos contentar con un modelo que nos parezca razonable y convincente de qué es 
lo computable. En este sentido, es muy afortunado que los distintos modelos de computación 



4.7. LA TESIS DE CHURCH 


101 


que se han usado para expresar lo que todos entienden por computadle, se han demostrado 
equivalentes entre sí. Algunos son: 

1. Máquinas de Turing. 

2. Máquinas de Acceso Aleatorio (RAM). 

3. Funciones recursivas. 

4. Lenguajes de programación (teóricos y reales). 

5. Cálculo A. 

6. Gramáticas y sistemas de reescritura. 

Esta saludable coincidencia es la que le da fuerza a la llamada Tesis de Church. 

Definición 4.24 La Tesis de Church establece que las funciones y problemas computables 
son precisamente los que pueden resolverse con una Máquina de Turing. 

Una buena forma de convencer a alguien con formación en computación es mostrar que 
las MTs son equivalentes a las máquinas RAM, pues estas últimas son una abstracción de 
los computadores que usamos todos los días. Existen muchos modelos de máquinas RAM. 
Describimos uno simple a continuación. 

Definición 4.25 Un modelo de máqina RAM es como sigue: existe una memoria formada 
por celdas, cada una almacenando un número natural nii e indexada por un número natural 
i > 0. Un programa es una secuencia de instrucciones L¡, numeradas en líneas l > 1. La 
instrucción en cada línea puede ser: 

1. Set i, a, que asigna rn t <— a, donde a es constante. 

2. Mov i, j, que asigna mi <— mj. 

3. Sum i, j, que asigna mi <— mi + rrq-. 

4- Sub i, j, que asigna mt <— max(0, — mj ). 

5. IfZ i, l, que si mi = 0 transfiere el control a la línea L¿, donde l es una constante. 

En todas las instrucciones, i (lo mismo j) puede ser un simple número (representando 
una celda fija mi), o también de la forma *i, para una constante i, donde i es ahora la 
dirección de la celda que nos interesa (m m J. 

El control comienza en la línea Li, y luego de ejecutar la pasa a la línea L í+1 , salvo 
posiblemente en el caso de IfZ. La entrada y la salida quedan en la memoria en posiciones 

convenidas. Una celda no accesada contiene el valor cero. La ejecución termina luego de 

ejecutar la última línea. 
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No es difícil convencerse de qne el modelo de máquina RAM que hemos definido es tan 
potente como cualquier lenguaje Ensamblador (Assembler) de una arquitectura (al cual a 
su vez se traducen los programas escritos en cualquier lenguaje de programación). De hecho 
podríamos haber usado un lenguaje aún más primitivo, sin Set, Sum y Stjb sino sólo INC m¿, que incrementa 
m¿. Tampoco es difícil ver que una máquina RAM puede simular una MT (¡el JTV es un 
buen ejemplo!). Veamos que también puede hacerse al revés. 

Una MT de 2 cintas que simula nuestra máquina RAM almacenará las celdas que han 
sido inicializadas en la cinta 1 de la siguiente forma: si rn t = a almacenará en la cinta 1 una 
cadena de la forma cP +1 cI a+1 c. La cinta estará compuesta de todas las celdas asignadas, con 
esta representación concatenada, y todo precedido por una c (para que toda celda comience 
con cc). Cada línea L¡ tendrá una pequeña MT que la simula. Luego de todas las líneas, 
hay una Mi extra que simplemente se detiene. 

1. Si Li dice Set i, a, la buscará ccP +1 c en la cinta 1. Si no la encuentra agregará 
ccl l+1 clc al final de la cinta (inicializando así m, •<— 0). Ahora, modificará lo que sigue 
a ccP +1 c para que sea I a+1 c (haciendo espacio de ser necesario) y pasará a M ¡ + Si la 
instrucción dijera Set *i, a, entonces se averigua (e inicia l i za, de ser necesario) el valor 
de m¿ sólo para copiar I mi a una cinta 2. Luego debe buscarse la celda que empieza 
con cd mi c en la cinta 1, y recién reemplazar lo que sigue por I a+1 c. En los siguientes 
ítems las inicializaciones serán implícitas para toda celda que no se encuentre, y no se 
volverán a mencionar. 

2. Si Li dice Mov i, j, la Mi buscará ccP +1 c en la cinta 1 y copiará los P s que le siguen 
en la cinta 2. Luego, buscará ccP +1 c en la cinta 1 y modificará los P s que siguen para 
que sean iguales al contenido de la cinta 2. Luego pasará a M¡ +í . Las adaptaciones 
para los casos « y/o *j son similares a los de Set y no se volverán a mencionar (se 
puede llegar a usar la tercera cinta en este caso, por comodidad). 

3. Si Li dice Sum i , j, la M¡ buscará ccP +1 c en la cinta 1 y copiará los P s que le siguen 
en la cinta 2. Luego, buscará ccP +1 c en la cinta 1 y, a los P s que le siguen, les agregará 
los de la cinta 2 menos uno. 

4. Si L¡ dice Sub i, j, la Mi buscará ccP +1 c en la cinta 1 y copiará los P s que le siguen en 
la cinta 2. Luego, buscará ccl l+1 c en la cinta 1 y, a los P s que le siguen, les quitará la 
cantidad que haya en la cinta 2 (dejando sólo un I si son la misma cantidad o menos). 

5. Si L¡ dice IfZ i, l', la Mi buscará ccP +1 c en la cinta 1. Luego verá qué sigue a ccl l+1 c. 
Si es Je, pasará a la My, sino a la M i+1 . 

No es difícil ver que la simulación es correcta y que no hay nada del modelo RAM 
que una MT no pueda hacer. Asimismo es fácil ver que se puede calcular lo que uno 
quiera calcular en un PC usando este modelo RAM (restringido a los naturales, pero éstos 
bastan para representar otras cosas como enteros, racionales, e incluso strings si se numeran 
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adecuadamente). Si el lector está pensando en los reales, debe recordar que en un PC no se puede 
almacenar cualquier real, sino sólo algunos racionales. 

Lema 4.3 Los modelos de la MT y la máquina RAM son computacionalmente equivalentes. 
Prueba: La simulación y discusión anterior lo prueban. □ 

En lo que resta, en virtud de la Tesis de Church, raramente volveremos a prefijar las 
palabras “decidible” y “aceptable” con “Turing-”, aunque algunas veces valdrá la pena 
enfatizar el modelo de MT. 


4.8 Gramáticas Dependientes del Contexto (GDC) 

[LP81, sec 5.2] 

Otro modelo de computación equivalente a MTs es el de las gramáticas dependientes 
del contexto, también llamadas “sistemas de reescritura”. Las estudiaremos en esta sección 
porque completan de modo natural la dicotomía que venimos haciendo entre mecanismos 
para generar versus reconocer lenguajes. 

Definición 4.26 Una gramática dependiente del contexto (GDC) es una tupia G = 
(V, E, R, S), donde 

1. V es un conjunto finito de símbolos no terminales. 

2. E es un conjunto finito de símbolos terminales, V fl E = 0. 

3. S G V es el símbolo inicial. 

4- R Cf (( V U E) + — E*) x(bU E)* son las reglas de derivación (conjunto finito). 
Escribiremos las reglas de R como x —>g z 0 simplemente x —* z en vez de (x, z ). 

Se ve que las GDCs se parecen bastante, en principio, a las GLCs del Capítulo 3, con la 
diferencia de que se transforman subcadenas completas (dentro de una mayor) en otras, no 
sólo un único símbolo no terminal. Lo único que se pide es que haya algún no terminal en 
la cadena a reemplazar. Ahora definiremos formalmente el lenguaje descrito por una GDC. 

Definición 4.27 Dada una GDC G = (V, E ,R,S), la relación lleva en un paso 
(V U E)* x (bU E)* se define como 

Vu,v, \/x —» Z G R, UXV uzv ■ 
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Definición 4.28 Definimos la relación lleva en cero o más pasos, =>g, como la clausura 
reflexiva y transitiva de 

Escribiremos simplemente ==>- y =>* cuando G sea evidente. 

Notamos que se puede llevar en cero o más pasos a una secuencia que aún contiene no 
terminales. Cuando la secuencia tiene sólo terminales, ya no se puede transformar más. 

Definición 4.29 Dada una GDC G = (V, E, i?, S), definimos el lenguaje generado por G, 
£(G), como 

C{G) = {w G E*, S w}. 


Finalmente definimos los lenguajes dependientes del contexto como los expresables con 
una GDC. 

Definición 4.30 Un lenguaje L es dependiente del contexto (DC) si existe una GDC G tal 
que L = C(G). 


Un par de ejemplos ilustrarán el tipo de cosas que se pueden hacer con GDCs. El primero 
genera un lenguaje que no es LC. 

Ejemplo 4.15 Una GDC que genere el lenguaje {te € {a, b, c}*, w tiene la misma cantidad de 
a’s, b's, y c’s } puede ser V = {5, A, B,C} y R con las reglas: 

S —> ABCS AB —y BA AC —y CA BC —yCB A —* a 

S —> e BA —y AB CA —y AC CB —y BC B —y b 

C ^ c 

A partir de S se genera una secuencia ( ABC ) n , y las demás reglas permiten alterar el orden de 
esta secuencia de cualquier manera. Finalmente, los no terminales se convierten a terminales. 


El segundo ejemplo genera otro lenguaje que no es LC, e ilustra cómo una GDC permite 
funcionar como si tuviéramos un cursor sobre la cadena. Esta idea es esencial para probar 
la equivalencia con MTs. 

Ejemplo 4.16 Una GDC que genera {a 2 ", n > 0}, puede ser como sigue: V = {5, [,], A, D} y R 
conteniendo las reglas: 

S —► [A] [ > [D 

[ —►* £>]—►] 

] — DA—y AAD 

A —y a 
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La operatoria es como sigue. Primero se genera [A], Luego, tantas veces como se quiera, aparece 
el “duplicador” D por la izquierda, y pasa por sobre la secuencia duplicando la cantidad de zl’s, 
para desaparecer por la derecha. Finalmente, se eliminan los corchetes y las A’s se convierten en 
a’s. Si bien la GDC puede intentar operar en otro orden, es fácil ver que no puede generar otras 
cosas (por ejemplo, si se le ocurre hacer desaparecer un corchete cuando tiene una D por la mitad 
de la secuencia, nunca logrará generar nada; también puede verse que aunque se tengan varias D’s 
simultáneas en la cadena no se pueden producir resultados incorrectos). 

Tal como las MTs, las GDCs son tan poderosas que pueden utilizarse para otras cosas 
además de generar lenguajes. Por ejemplo, pueden usarse para calcular funciones: 

Definición 4.31 Una GDC G = (V, E, R , S ) computa una función f : Eq —y Ej si existen 
cadenas x,y,x',y' G (V U E)* tal que, para toda u G Eq, xuy x'vy' sii v = f(u). 

Si existe tal G decimos que f es gramaticalmente computable. Esta definición incluye las 
funciones de N en N mediante convertir I n en I^ n ^. 

Ejemplo 4.17 Una GDC que calcule f(n) = 2 n es parecida a la del Ej. (4.16), V = {D}, R 
conteniendo la regla Da —y aaD , y con x = D, y = e, x' = e, y' = D. Notar que es irrelevante 
cuál es el símbolo inicial de G. 


Otro ejemplo interesante, que ilustra nuevamente el uso de cursores, es el siguiente. 

Ejemplo 4.18 Una GDC que calcule f(w) = w R con E = {a, 6} puede ser como sigue: x 
y = *], x' = [*, y' =], y las reglas 


[a —> [A 
Aa —> aA 
Ab —> bA 
A* —y *a 


[b^[B 
Ba —y aB 
Bb—ybB 
B* —y *b 


Demostremos ahora que las GDCs son equivalentes a las MTs. Cómo hacer esto no es 
tan claro como en los capítulos anteriores, porque podemos usar tanto las GDCs como las 
MTs para diversos propósitos. Pero vamos a demostrar algo suficientemente fundamental 
como para derivar fácilmente lo que queramos. 

Lema 4.4 Sea M = (K, E, 5, s ) una MTD. Entonces existe una GDC G = (' V , E, R, S ) 
donde V — K U {h, [, ]} tal que ( q,uav ) \~* M ( q',u'gf_v') sii [uqav] =^* G [u'q'a'v']. 

Prueba: Las reglas necesarias se construyen en función de 6. 

1. Si S(qi, a) = (q 2 ,<) agregamos a R las reglas bq\ac —y q 2 bac para todo 6 gE, cGEU{]}, 
excepto el caso ac = jf\, donde bqi#\ —y q-^b] evita que queden #’s espurios al final de la 
configuración. 
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2. Si 5(qi, a) = ( q 2 , >) agregamos a R las reglas qicib —> aq 2 b para todo b £ E, y q\ci ] —> 0 ( 72 #] 
para extender la cinta cuando sea necesario. 

3. Si 5(qi,a) = ( q 2 ,b ) agregamos a R la regla q\a —)• q 2 b. 

Es fácil ver por inspección que estas reglas simulan exactamente el comportamiento de M. □ 
Con el Lema 4.4 es fácil establecer la equivalencia de MTs y GDCs para calcular funciones. 

Teorema 4.1 Toda función Turing-computable es gramaticalmente computable, y viceversa. 

Prueba: Sea / Turing-computable. Entonces existe una MTD M = ( K , E, 5, s ) tal que para todo 
u , (s, #«#) \~* M ( h , #/(it)#). Por el Lema 4.4, existe una GDC G tal que [#«s#] [#/(«)##] 

(y a ninguna otra cadena terminada con ú#], pues M es determinística). Entonces, según la 
Def. 4.31, / es gramaticalmente computable, si elegimos x = [#, y = s#], x' = [#, y' = hff\. 

La vuelta no la probaremos tan detalladamente. Luego de haber construido la MUT 
(Sección 4.6), no es difícil ver que uno puede poner la cadena inicial (rematada por x e y en 
las dos puntas) en la cinta 1, todas las reglas en una cinta 2, y usar una MTND que elija la regla 
a aplicar, el lugar donde aplicarla, y si tal cosa es posible, cambie en la cinta 1 la parte izquierda 
de la regla por la parte derecha. Luego se verifica si los topes de la cinta son x' e y'. Si lo son, la 
MTND elimina x' e y' y se detiene, sino vuelve a elegir otra regla e itera. En este caso sabemos 
que la MTND siempre se terminará deteniendo y que dejará el resultado correcto en la cinta 1. □ 

Nótese que, usando esto, podemos hacer una GDC que “decida” cualquier lenguaje 
Turing-decidible L. Lo curioso es que, en vez de generar las cadenas de L , esta GLC las 
convierte a S o a N según estén o no en L. ¿Y qué pasa con los lenguajes Turing-aceptables? 
La relación exacta entre los lenguajes generados por una GDC y los lenguajes decidióles 
o aceptables se verá en el próximo capítulo, pero aquí demostraremos algo relativamente 
sencillo de ver. 

Teorema 4.2 Sea G = (V, E, R, S ) una GDC. Entonces existe una MTND AL tal que, para 
toda cadena w G L(G), ( s , #) \~* M ( h , #«;#). 

Prueba: Similarmente al Teo. 4.1, ponemos todas las reglas en una cinta 2, y #<S'# en la cinta 
1. Iterativamente, elegimos una parte izquierda a aplicar de la cinta 2, un lugar donde aplicarla en 
la cinta 1, y si tal cosa es posible (si no lo es la MTND cicla para siempre), reemplazamos la parte 
izquierda hallada por la parte derecha. Verificamos que la cinta 1 tenga puros terminales, y si es 
así nos detenemos. Sino volvemos a buscar una regla a aplicar. □ 

El teorema nos dice que una MTND puede, en cierto sentido, “generar” en la cinta 
cualquier cadena de un lenguaje DC. Profundizaremos lo que esto significa en el siguiente 
capítulo. 
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4.9 Ejercicios 

1. Para las siguientes MTs, trace la secuencia de configuraciones a partir de la que se 
indica, y describa informalmente lo que hacen. 

(a) M = ({g 0 ,gi},{ a A#},¿,<?o), con 6(q 0 ,a) = (qi,b), S(q 0 ,b) = (qi,a), 6(q 0 ,#) = 
(/i,#), S(qi,a) = (qo, >), S = (q u b) = (g 0 ,>), %i,#) = (9o,>)- Configuración 
inicial: ( q 0 ,aabbba ). 

(b) M = ({q 0 ,q 1 ,q 2 },{a,b,#} 1 ó 1 q 0 ), con S(q 0 ,a) = (q i,<), S(q 0 ,b) = (q Q ,>), 

¿(9o,#) = (9o, >) , 5(?i,a) = (9i,<), 5(?i,6) = (« 2 ,>), 5(?i,#) = 

(?i,<), 5(g 2 ,a) = (<? 2 ,>), 5(g 2 ,6) = (? 2 ,>), = (? 2 ,#), a partir de 

(g 0 , abb#bb##aba). 

(c) M = ({<?o, <?i, < 72 }, {«, #}, <7o), con <5(g 0 ,a) = (<?i, <l), 5(g 0 ,#) = (ío,#), 

5(?i,a) = ( 92 ,#), 5(9i,#) = 5(92, a) = (q 2 ,a), S(q 2 ,#) = ( 90 , <).* a 

partir de (g 0 , ('«- > 0). 

2. Construya una MT que: 

(a) Busque hacia la izquierda hasta encontrar aa (dos a seguidas) y pare. 

(b) Decida el lenguaje {w G {a,b}*, w contiene al menos una a}. 

(c) Compute f(w) = ww. 

(d) Acepte el lenguaje a*ba*b. 

(e) Decida el lenguaje {w G {a,b}*, w contiene tantas a’s como 6’s}. 

(f) Compute f(m, n) = m div n y m mod n. 

(g) Compute f(m,n) = m n . 

(h) Compute f(m,n) = [log m nj. 

3. Considere una MT donde la cinta es doblemente infinita (en ambos sentidos). Defínala 
formalmente junto con su operatoria. Luego muestre que se puede simular con una 
MT normal. 

4. Imagine una MT que opere sobre una cinta 2-dimensional, infinita hacia la derecha y 
hacia arriba. Se decide que la entrada y el resultado quedarán escritos en la primera 
fila. La máquina puede moverse en las cuatro direcciones. Simule esta máquina para 
mostrar que no es más potente que una tradicional. 

5. Imagine una MT que posea k cabezales pero sobre una misma cinta. En un paso lee 
los k caracteres, y para cada uno decide qué escribir y adonde moverse. Descríbala 
formalmente y muestre cómo simularla con un sólo cabezal. 
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6. Construya MTNDs que realicen las siguientes funciones. 

(a) Acepte a*abb*baa*. 

(b) Acepte {ww R , w G {a, &}*}. 

(c) Acepte {a n , 3 p, q > 0, n = p 2 + q 2 }. 

(d) Termine si y sólo si el Teorema de Fermat es falso (3x, y, z,n G N, n >2 ,x,y,z> 
0 , x n + y n = z n ). 

7. Codifique las MTs del Ejercicio 1 usando p. Siga las computaciones sugeridas en la 
versión representada, tal como las haría la MUT. 

8. Construya una GDC que: 

(a) Calcule f(n) = 2 n . 

(b) Genere {a n b n c n , n > 0}. 

(c) Genere {te G {a, b , c}*, w tiene más a’s que Es y más Es que c’s}. 

(d) Genere {ww, w G {a, b}*}. 


4.10 Preguntas de Controles 

A continuación se muestran algunos ejercicios de controles de años pasados, para dar una 
idea de lo que se puede esperar en los próximos. Hemos omitido (i) (casi) repeticiones, ( ii ) 
cosas que ahora no se ven, {ni) cosas que ahora se dan como parte de la materia y/o están 
en los ejercicios anteriores. Por lo mismo a veces los ejercicios se han alterado un poco o se 
presenta sólo parte de ellos, o se mezclan versiones de ejercicios de distintos años para que 
no sea repetitivo. 

C2 1996 Cuando usamos MT para simular funciones entre naturales, representamos 
al entero n como I n . Muestre que también se puede trabajar con los números 
representados en binario. Suponga que tiene una MT con un alfabeto E = {0,1} 
(puede agregar símbolos si lo desea). Siga los siguientes pasos (si no puede hacer 
alguno suponga que lo hizo y siga con los demás): 

a) Dibuje una MT que sume 1 a su entrada, suponiendo que se siguen las 
convenciones usuales (el cabezal empieza y termina al final del número), por 
ejemplo (s, #011#) -V (h,# 100#). 

b ) Similarmente dibuje una MT que reste 1 a su entrada si es que ésta no es cero. 

c) Explique cómo utilizaría las dos máquinas anteriores para implementar la suma 
y diferencia (dando cero cuando el resultado es negativo), por ejemplo en el caso 
de la suma: (s,#011#101#) —¡>* (h, #1000#). 
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Ex 1996, 2001 Considere los autómatas de 2 pilas. Estos son similares a los de una pila, 
pero pueden actuar sobre las dos pilas a la vez, independientemente. Aceptan una 
cadena cuando llegan a un estado final, independientemente del contenido de las pilas. 

a) Defina formalmente este autómata, la noción de configuración, la forma en que se 

pasa de una configuración a la siguiente, y el lenguaje que acepta, 

b) Use un autómata de 2 pilas para reconocer el lenguaje {a n b n c n , n > 0}. 

c) Muestre cómo puede simular el funcionamiento de una MT cualquiera usando un 

autómata de 2 pilas. Qué demuestra esto acerca del poder de estos autómatas? 

d) Se incrementa el poder si agregamos más pilas? Por qué? 

C2 1997 Diseñe una MT que maneje un conjunto indexado por claves. En la cinta viene 
una secuencia de operaciones, terminada por Cada operación tiene un código (un 
carácter) y luego vienen los datos. Las operaciones son 

• Insertar: El código es /, luego viene una clave (secuencia de dígitos) y luego 
el dato (secuencia de letras entre ’a’ y V). Si la clave ya está en el conjunto, 
reemplazar el dato anterior. 

• Borrar: El código es U, luego viene una clave. Si la clave no está en el conjunto, 
ignorar el comando, sino eliminarla. 

• Buscar: Viene exactamente una operación de buscar al final de la secuencia, el 
código es A y luego viene una clave. Se debe buscar la clave y si se la encuentra 
dejar escrito en la cinta el dato correspondiente. Si no se la encuentra se deja 
vacía la cinta. 

Para más comodidad suponga que las claves tienen un largo fijo, y lo mismo con los 
datos. Mantenga su conjunto en una cinta auxiliar de la forma que le resulte más 
cómoda. Puede usar extensiones de la MT, como otras cintas, no determinismo, etc., 
pero el diseño de la MT debe ser detallado. 

Ex 1997, 2001 Se propone la siguiente extensión a la MT tradicional: en vez de una sola 
MT tenemos varias (una cantidad fija) que operan sobre una cinta compartida , cada 
una con su propio cabezal. A cada instrucción, cada máquina lee el carácter que 
corresponde a su cabezal. Una vez que todas leyeron, cada máquina toma una acción 
según el carácter leído y su estado actual. La acción puede ser mover su cabezal o 
escribir en la cinta. Si dos máquinas escriben a la vez en una misma posición puede 
prevalecer cualquiera de las dos. La máquina para cuando todas paran. 

Explique en palabras (pero en detalle) cómo puede simular esta MT extendida usando 
una MT tradicional (o con alguna extensión vista). 
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Indique como utilizaría una de estas máquinas para resolver el problema de ordenar 
una entrada de K caracteres (no necesariamente todos distintos) del alfabeto E = 
{ai, <t 2 , ..., a n } y tal que oy < <r 2 < ... < cr n . Indique el número de MT’s originales 
que la componen y cuál sería su funcionamiento. 

C2 1998 Construya (puede usar extensiones) una MT que reciba en la cinta 1 una cadena de 
la forma y en la cinta 2 una cadena de la forma 

Se supone que todas las cadenas y v 3 pertenecen a {a, b}*, y que tenemos el mismo 
número de cadenas en ambas cintas. 

La máquina debe determinar si las son un reordenamiento de las Vj o no y detenerse 
sólo si no lo son. 

C2 2002 Diseñe una gramática dependiente del contexto que genere el lenguaje L = {a n , n 
es un número compuesto}, donde un número compuesto es el producto de dos números 
mayores que uno. 

Ex 2002 La Máquina Gramatical de Turing (MGT) se define de la siguiente forma. 
Recibe p(G)p(w), donde G es una gramática dependiente del contexto y p(G) alguna 
representación razonable de G\ y una cadena w representada mediante p{w). La MGT 
se detiene si y sólo si w e L(G), es decir acepta el lenguaje C(MGT) = {p(G)p(w), w G 
L(G)}. 

Describa la forma de operar de la MGT (detalladamente, pero no necesita dibujar 
MT’s, y si lo hace de todos modos debe explicar qué se supone que está haciendo). 

C2 2003 Diseñe una MT que calcule el factorial. Formalmente, la máquina M debe cumplir 

(s, #/"#) I - m Ml n '±) 

Puede usar varias cintas y una máquina multiplicadora si lo desea. 

C2 2003 Dada una MT que computa una función / : E* —» E*, indique cómo construir una 
MT que compute la función inversa x = f~ x (w) para algún x tal que f(x) = w (puede 
hacer lo que sea si no existe tal x ). Indique qué hace su MT cuando (i) existe más de 
un argumento x tal que f(x) = w] ( ii ) no existe ningún argumento x tal que f(x) = w. 

Ex 2006 Considere un modelo de computación donde una MT (robotizada) puede, mediante 
una instrucción atómica, fabricar otra MT. La nueva MT es idéntica y arranca con la 
misma configuración de la MT fabricante. Para poder diferenciarlas, la MT fabricante 
queda con un 0 bajo el cabezal luego de fabricar la copia, mientras que la copia queda 
con un 1 bajo el cabezal cuando arranca su ejecución luego de ser copiada. 

Las dos MTs siguen trabajando en paralelo y sincronizadamente, pero sin comunicarse. 
Tanto la copia como la original pueden fabricar nuevas copias. Cuando alguna copia 
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se detiene, envía un mensaje a todas las demás para que se detengan también y se 
auto destruyan. La MT que terminó es la única que sobrevive. 

Describa formalmente esta nueva MT: incluya la definición de la MT, lo que es una 
configuración, cómo se pasa de una configuración a la siguiente, la noción de decidir y 
aceptar, y el lenguaje decidido y aceptado por una MT. 

C2 2007 Un autómata de cola es igual a uno de pila, excepto que en vez de una pila usa 
una cola (es decir, los símbolos salen en el mismo orden en que entraron). 

1. Defina formalmente un autómata de cola, el concepto de configuración y el 
lenguaje aceptado por este autómata. 

2. Demuestre que un autómata de cola puede aceptar un lenguaje que no es libre 
del contexto (por ejemplo L = {ww, w G {a, &}*}). 

3. Demuestre que un autómata de cola puede aceptar cualquier lenguaje Turing- 
aceptable (un buen comienzo es mostrar que puede simular la cinta usando la 
cola). 

C2 2007 Considere un alfabeto S = {cp, a 2 ,..., a n }. Definamos el orden lexicográfico entre 
caracteres como a % < a¿ + i. Dibuje una MT que reciba en la entrada una cadena 
w G E* y la ordene, es decir, ponga todos los caracteres de w en orden lexicográfico 

(por ejemplo (s, # 04020102 #) P* (h, # 01020204 #)). 

(Note que n es fijo, no depende del largo de la entrada.) Puede usar varias cintas, pero 
no una cantidad dependiente de n. 

Ex 2007 Sea M una MT que siempre termina frente a su entrada, calculando una cierta 
función. Demuestre que el problema de determinar si la función que M calcula es 
biyectiva no es computadle. 

Ex 2008 Sea k- PA un autómata de pila con k pilas. Por lo tanto un 0-PA es un AFND y 
un 1-PA es un simple PA. Se sabe que un 1-PA es más poderoso que un 0-PA, pues 
permite reconocer más lenguajes. 

1. Mostrar que un 2-PA es más poderoso que un 1-PA. 

2. Mostrar que un 3-PA no es más poderoso que un 2-PA. (Ayuda: Piense en una 
MT) 

4.11 Proyectos 

1. Familiarícese con JTV (http://www.dcc.uchile.cl/jtv) y traduzca algunas de las 
MTs vistas, tanto MTDs como MTNDs, para simularlas. 
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2. Dibuje la MUT usando JTV y simule algunas ejecuciones. 

3. Tome algún lenguaje ensamblador y muestre que las funciones que puede calcular son 
las mismas que en nuestro modelo de máquina RAM. 

4. Investigue sobre funciones recursivas como modelo alternativo de computación. Una 
fuente es [LP81, sec. 5.3 a 5.6]. 

5. Investigue sobre lenguajes simples de programación como modelo alternativo de 
computabilidad. Una fuente es [DW83, cap. 2 a 5]. Esto entra también en el tema del 
próximo capítulo. 

6 . Investigue más sobre el modelo RAM de computación. Una fuente es [AHU74, cap 1]. 
Esto entra también en el tema del próximo capítulo. 
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Capítulo 5 

Computabilidad 


[LP81, cap 5 y 6] 

Una vez establecido nuestro modelo de computación y justificado con la Tesis de Church, 
en este capítulo vamos por fin a demostrar los resultados centrales de qué cosas se pueden 
computar y qué cosas no. 

Comenzaremos con una famosa demostración de que el problema de la detención (o halting 
problem ) no se puede resolver por computador, es decir, que es indecidiblc. Esta demostración 
arroja luz sobre la diferencia entre decidir y aceptar un lenguaje. Luego profundizaremos 
más en esa relación, y finalmente mostraremos cómo demostrar que otros problemas son 
incleciclibles, dando ejemplos de problemas al parecer relativamente simples que no tienen 
solución. 


5.1 El Problema de la Detención 

Comencemos con algunas observaciones relativamente simples sobre la relación entre decidir 
y aceptar lenguajes. 

Lema 5.1 Si un lenguaje L es decidible, entonces L c es decidible. 

Prueba: Si L es decidible entonces existe una MT M que, empezando en la configuración 

(s, ifcwjf) \~* M ( h , #S#:) si w € L y (s, #wjf) \~* M (h, #N#) si no. Entonces, basta con ejecutar M 
y luego invertir su respuesta para decidir L c : 


>M < 



S> 


N > 


□ 


Lema 5.2 Si un lenguaje L es decidible, entonces es aceptable. 
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Prueba: Si L es decidible entonces existe una MT M que, empezando en la configuración 

(s, ffwjf) \~* M ( h , si w € L y (s, ffwffi) (á, #N^¿) si no. Entonces, la siguiente MT 

zM < N 



se detiene sii w € L, es decir, acepta L y por lo tanto L es aceptable. □ 

El lema anterior es bastante evidente: si podemos responder sí o no frente a una cadena 
del lenguaje, claramente podemos detenernos si la cadena está en el lenguaje y no detenernos 
sino. 

Tal como hemos visto que los complementos de lenguajes decididles son decidibles, 
podríamos preguntarnos si los complementos de lenguajes aceptables son aceptables. El 
siguiente lema nos dice algo al respecto. 

Lema 5.3 Si L es aceptable y L c es aceptable, entonces L es decidible. 

Prueba: Si tenemos una M\ que acepta L y una A'fi que acepta L c , entonces, dada una cadena 
w exactamente una entre M\ y A'fi se detendrán frente a w. Podemos correr una MTND M que, 
no determinísticamente, elige correr M\ ó AI 2 - Lo que corre en el caso de AI\ es realmente una 
variante que funciona en la cinta 2, y cambia el estado h por >( 1 )sí 1 )[>( 1 ). Lo que corre en el caso 
de AI 2 es realmente una variante que funciona en la cinta 2, y cambia el estado h por >( 1 )n( 1 )[>( 1 ). 
Está claro que AI siempre va a terminar y dejar en la cinta 1 la respuesta S o N según w € L o no. 
□ 


Por lo tanto, si los complementos de los lenguajes aceptables fueran aceptables, todos los 
lenguajes aceptables serían decidibles. La pregunta interesante es entonces: ¿será que todo 
lenguaje aceptable es decidible? 

Observación 5.1 ¿Qué implicaciones tendría que esto fuera verdad? Esto significaría que, 
dada una MT que se detuviera sólo frente a cadenas de un cierto lenguaje L, podríamos 
construir otra que se detuviera siempre, y nos dijera si la cadena está en L o no, es decir, si 
la primera MT se detendría frente a L o no. Por ejemplo, no sería difícil hacer una MTND 
que intentara demostrar un cierto teorema (tal como hemos hecho una que intenta generar 
cierta palabra con una GDC, Teo. J h 2). Luego podríamos saber si el teorema es cierto o no 
mediante preguntarnos si la MTND se detendrá o no. ¡Tendríamos un mecanismo infalible 
para saber si cualquier teorema, en cualquier sistema formal, es demostrable o no! Podríamos 
haber resuelto el último teorema de Fermat o la hipótesis del continuo sin mayor esfuerzo, 
o la aún no demostrada conjetura de Goldbach (todo número par mayor que 2 es la suma 
de dos primos). Otra forma más pedestre de ver esto es como sigue. Bastaría hacer un 
programa que fuera generando cada contraejemplo posible a la conjetura de Goldbach (todos 
los números pares), probara si es la suma de dos primos, y se detuviera si no. Sabríamos si 
la conjetura es falsa o no mediante preguntarnos si el programa se detendrá o no. 
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Esta observación, además de adelantar cierto pesimismo sobre la posibilidad de qne los 
lenguajes aceptables sean decidibles, muestra que un cierto lenguaje en particular es esencial 
para responder esta pregunta. 

Definición 5.1 El problema de la detención (o halting problern ) es el de, dada una MT 
M y una cadena w, determinar si M se detendrá frente a w, es decir, si M acepta w, o 
formalmente, si (s,ffwff) \~* M ( h,uav ) para algún uav. 

Este problema se puede traducir al de decidir un lenguaje, gracias al formalismo 
introducido para la MUT (Sección 4.6). 

Definición 5.2 El lenguaje Kq C {/, c}* se define como sigue: 

K 0 = {p(M)p(w), M acepta w} 


Podemos pensar en Kq, informalmente, como el lenguaje de los pares ( M,w ) tal que M 
acepta w. Pero, por otro lado, Kq es nada más que un conjunto de cadenas de c’s e J’s. Es 
inmediato que K 0 es aceptable. 

Lema 5.4 K 0 es aceptable. 

Prueba: 

Basta ver que la MUT definida en la Def. 4.23 acepta precisamente I\q, mediante simular M 
frente a la entrada w. Entonces la MUT aceptará p(M)p(iu) sii M acepta w. El único detalle es que 
la MUT supone que la entrada es de la forma p{M)p(w), mientras que ahora deberíamos primero 
verificar que la secuencia de c’s y P s de la entrada tiene esta forma. Si no la tiene, no deberíamos 
aceptar la cadena (es decir, deberíamos entrar a un loop infinito). No es difícil decidir si la entrada 
tiene la forma correcta, queda como ejercicio para el lector. □ 

El siguiente lema establece la importancia de Kq con respecto a nuestra pregunta. 

Lema 5.5 Kq es decidible sii todo lenguaje aceptable es decidible. 

Prueba: La vuelta es evidente dado que Kq es aceptable. Para la ida, supongamos que Kq es 
decidible, es decir, existe una MT Mq que decide Kq: dada p(M)p(iu), responde S si M se detendrá 
frente a w, y N sino (o si la entrada no es de la forma p{M)p(w)). Ahora supongamos que un cierto 
L es aceptable: tenemos una MT M que se detiene frente a w sii iu € L. Construimos una MT 
M' que escriba en la cinta p(M ) (una constante) y luego codifique w como p(w). A la entrada 
resultante, p(M)p(u>), se le aplica la MT que decide Kq, con lo cual nos responderá, finalmente, si 
w £ L o no. □ 

De este modo, nuestra pregunta se reduce a ¿es Kq decidible? Para avanzar en este 
sentido, definiremos un lenguaje K\ a partir de Kq. 
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Definición 5.3 El lenguaje K\ se define como 

K | = {p(M), AL acepta p(M)} 

y asimismo vale la pena escribir explícitamente 

K( = {w G {c, /}*, w es de la forma p(M ) ?/ AL no acepta p(M), 
o w no es de la forma p(M)} 

Para que esto tenga sentido, debemos aclarar que estamos hablando de MTs AL codificables 
(Def. f.18), y de que acepten la versión codificada de p(AL). 

Observación 5.2 Antes de continuar, asegurémoselos de entender el tecnicismo involucrado 
en la definición de K\. No todas las MTs tienen un alfabeto formado por c’s y I ’s, de modo 
que ¿qué sentido tiene decir que aceptan p(AL), que es una secuencia de c’s y I’s? Lo que 
aclara la definición es que no nos referimos a cualquier MT sino a MTs codificables, cuyo 
alfabeto es de la forma ai, a 2 , etc. (Def. j.18). A su vez, hablamos de la versión codificada de 
p(AL), donde, por ejemplo, c se convierte en a 2 el en a 3 (recordemos que a\ está reservado 
para el #). Ahora sí funciona: toda MT que tenga al menos tres símbolos en su alfabeto 
(que renombramos ai, a 2 y a 3 ) aceptan o no cadenas formadas por a 2 y a 3 , y K\ son las 
MTs tales que si las codificamos con c’s e I ’s, traducimos esa codificación a a 2 ’s y a 3 ’s, y 
se las damos como entrada a la misma M, terminarán. ¿ Y las MTs que tienen alfabetos de 
menos de tres símbolos? Pues las dejamos fuera de K\. 

Una vez comprendido el tecnicismo, es bueno no prestarle mucha antención y tratar de 
entender más intuitivamente qué es Ki. Esencialmente, K\ es el conjunto de las MTs que 
se aceptan a sí mismas. Similarmente, K{ sería el conjunto de las MTs que no se aceptan a 
sí mismas (más las cadenas que no representan ninguna p(M)). 

El siguiente lema debería ser evidente. 

Lema 5.6 Si K 0 es aceptable/decidible, entonces K\ es aceptable/decidible. Por lo tanto 
Ki es aceptable. 

Prueba: Sea M que acepta/decide Kq. Entonces una M' que acepta/decide K\ simplemente 
recibe p(Af) en la cinta de entrada, le concatena p(p(M)), e invoca AI. La doble p se debe a que 
estamos codificando la cadena w = p(M) en el lenguaje de c’s e /’s ¡a pesar de que ya lo estuviera! 
Es decir, si c = a 2 y I = a 3 , entonces c se (re)codificará como lili e I como /////. □ 

Notar que bastaría que K{ fuera aceptable para que K\ fuera decidible. En seguida 
demostraremos que no lo es. 

Antes de ir a la demostración formal, es muy ilustrativo recurrir a la paradoja del barbero 
de Russell (usada originalmente para demostrar que no toda propiedad define un conjunto). 
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Definición 5.4 La paradoja del barbero de Russell es como sigue: Erase un pueblo con 
un cierto número de barberos. Estos afeitaban a los que no eran barberos. Pero ¿quién los 
afeitaría a ellos? Algunos querían afeitarse ellos mismos, otros preferían que los afeitara 
otro barbero. Después de discutir varios días, decidieron nombrar a uno sólo de ellos como el 
barbero de todos los barberos. Este barbero, entonces, estaría a cargo de afeitar exactamente 
a todos los barberos que no se afeitaran a sí mismos. El barbero designado quedó muy contento 
con su nombramiento, hasta que a la mañana siguiente se preguntó quién lo afeitaría a él. 
Si se afeitaba él mismo, entonces estaba afeitando a alguien que se afeitaba a sí mismo, 
incumpliendo su designación. Pero si no se afeitaba él mismo, entonces no estaría afeitando 
a alguien que no se afeitaba a sí mismo, también incumpliendo su designación. El barbero 
renunció y nunca lograron encontrar un reemplazante. 

La paradoja muestra que no es posible tener un barbero que afeite exactamente a los 
barberos que no se afeitan a sí mismos. Si cambiamos “barbero” por “MT” y “afeitar” por 
“aceptar” habremos comprendido la esencia del siguiente lema. 

Lema 5.7 K( no es aceptable. 

Prueba: Supongamos que lo fuera. Entonces existirá una MT M que acepta Kf. Nos preguntamos 
entonces si la versión codificable de M acepta la cadena w = p(M) (codificada). 

1. Si la acepta, entonces p(M) £ K\ por la Def. 5.3. Pero entonces M acepta una cadena 
w = p{M) que no está en K f sino en K\, contradiciendo el hecho de que M acepta K(. 

2. Si no la acepta, entonces p(M) € K ( por la Def. 5.3. Pero entonces M no acepta una cadena 
w = p(M) que está en K\, nuevamente contradiciendo el hecho de que M acepta K'¡. 

En ambos casos llegamos a una contradicción, que partió del hecho de suponer que existía una M 
que aceptaba K[. Entonces K{ no es aceptable. □ 

Observación 5.3 La demostración del Lema 5.1 es una forma de diagonalización (usado 
en el Teo. 1.2). En una matriz, enumeramos cada MT M en una fila, y cada cadena w en 
una columna. Cada celda vale 1 si la MT (fila) se detiene frente a la cadena (columna). En 
cada fila i de una MT Mi, una de las celdas (llamémosla Ci) corresponde a la cadena p(M¿). 
Una MT que aceptara K( debería tener un 0 en Ci si la MT M.\ tiene un 1 (se acepta a sí 
misma) y un 1 en Ci si Mi tiene un 0 (no se acepta a sí misma). Pero entonces esa MT que 
acepta K( no puede ser ninguna de las MT listadas, pues difiere de cada fila i de la matriz 
en la columna Ci. Por lo tanto no existe ninguna MT que acepte K(. 

De aquí derivamos el teorema más importante del curso. Contiene varias afirmaciones 
relacionadas. 

Teorema 5.1 K 0 y K\ son aceptables pero no decidibles. Ni Kq ni K{ son aceptables. 
Existen lenguajes aceptables y no decidibles. No todos los complementos de lenguajes 
aceptables son aceptables. El problema de la detención es indecidible. 
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Prueba: K\ no es decidible porque si lo fuera entonces Kf también sería decidible (Lema 5.1), 
y ya vimos que Kf no es siquiera aceptable (Lema 5.7). Como K\ no es decidible, Kq tampoco 
lo es (Lema 5.6), y por el mismo lema, como Kf no es aceptable, Kq tampoco lo es. Como Kq y 
K\ son aceptables y no decidibles, no todo lenguaje aceptable es decidible, y no todo complemento 
de lenguaje aceptable es aceptable (pues sino todos los lenguajes aceptables serían decidibles, 
Lema 5.3). En particular, el problema de la detención (decidir Kq) es indecidible. □ 

Observación 5.4 Esto significa, en particular, que es imposible determinar si un programa 
se detendrá frente a una entrada. Es decir, en general. Para ciertos programas y/o ciertas entradas 
puede ser muy fácil, pero no se puede tener un método que siempre funcione. Los métodos de verificación 
automática de programas (que intentan demostrar su correctitud) no tienen esperanza de 
algún día funcionar en forma totalmente automática, pues ni siquiera es posible saber si un 
programa se detendrá. 

El hecho de que las MTs puedan no detenerse parece ser un problema. ¿No sería mejor 
tener un formalismo de computación donde todos los programas terminaran? Por ejemplo 
un lenguaje de programación sin WHILE, sino sólo con un tipo de For que garantizara 
terminación. Si nos acostumbráramos a programar así, se evitarían muchos errores. 

El siguiente teorema demuestra que no es así. Todo mecanismo de computación, para ser 
tan completo como las MTs, requiere que existan programas que no terminan y más aún, que 
sea indecidible saber si terminarán o no. (En todos los formalismos alternativos mencionados 
en la Sección 4.7 existen instrucciones que permiten la no terminación.) 

Teorema 5.2 Sea un mecanismo de computación de funciones de N en N, tal que existe 
una forma finita de representar las funciones como secuencias de símbolos, de verificar la 
correctitud de una representación, y de simular las funciones con una MT a partir de la 
representación, de modo que la simulación siempre termina. Entonces existen funciones 
computables con MTs y que no se pueden calcular con este mecanismo. 

Prueba: Llamemos /¿ a la í-ésima representación correcta de una función que aparece cuando 
se van generando todas las cadenas posibles en orden de longitud creciente y, dentro de la misma 
longitud, en orden lexicográfico. Definamos la matriz F.¿j = ffij). Ahora, sea f(n ) = f n (n ) + 1. 
Claramente esta función no está en la matriz, pues difiere de cada f¿ en el valor /¿(z), y por lo tanto 
no puede computarse con el nuevo mecanismo. Sin embargo, una MT puede calcularla: Basta 
enumerar cadenas e ir verificando si representan funciones correctas, deteniéndonos en la n-ésima, 
simulando su funcionamiento con el argumento n, y finalmente sumando 1 al resultado. □ 

El teorema está expresado en términos de funciones de naturales en naturales, pero no 
es difícil adaptarlo a lo qne se desee. El enunciado se ve un poco técnico pero no tiene 
nada muy restrictivo. Es difícil imaginarse un sistema razonable de computación donde las 
funciones no puedan enumerarse (esto ya lo hemos discutido en la Sección 4.7), lo qne es lo 
mismo qne representarse como una secuencia de alguna forma; o qne no se pueda saber si 
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una secuencia representa una descripción sintácticamente correcta de una función; o que no 
pueda simularse con una MT a partir de la representación (Tesis de Church). 

¿En qué falla el teorema si lo tratamos de aplicar a un formalismo donde algunas f(i ) 
pueden no terminar? En que, si resulta que f n (n) no termina, no podremos “sumarle 1”. 
Nuestro mecanismo propuesto para calcular f n (n ) + 1 tampoco terminará. Ni siquiera 
podremos decidir darle un valor determinado a las que no terminan, porque no tenemos 
forma de saber si termina o no. Cualquier valor que le demos a f(n), puede que f n (n) 
finalmente termine y entregue el mismo valor. Por lo tanto, es esencial que haya funciones 
que no terminan, y que el problema de la detención sea indecidible, para que un sistema de 
computación sea completo. 

5.2 Decidir, Aceptar, Enumerar 

En esta sección veremos algunas formas alternativas de pensar en lenguajes aceptables y 
decidibles, que serán útiles para demostrar la indecidibilidad de otros problemas. 

Definición 5.5 El lenguaje de salida de una MT M es el conjunto 

{w G (E — {#})*, 3u e (E - {#})*, (a, #u#) b*, (h, #w±) } 

En el caso de que M compute una función f, esto es la imagen de f. 

El siguiente lema dice que los lenguajes aceptables son los lenguajes de salida. 

Lema 5.8 Un lenguaje es aceptable sii es el lenguaje de salida de alguna MT. 

Prueba: Sea L un lenguaje aceptado por una MT M. Crearemos una MT M' que calcule la 
función f(w) = w para las w G L y no se detenga si w L. Claramente L será el lenguaje de salida 
de M'. M' simplemente copia la entrada w a la cinta 2 y corre M en la cinta 2. Si M termina 
( w € L), la salida que quedará será la de la cinta 1. Si M no termina (w 0 L), M' tampoco 
termina. 

Sea ahora L el lenguaje de salida de una MT M. Para aceptar L, una MTND puede generar 
no determinísticamente una u en una cinta 2, correr M sobre ella en la cinta 2, y detenerse sólo si 
el resultado de la cinta 2 es igual al de la cinta f. □ 

Otra caracterización interesante de los lenguajes aceptables tiene que ver con el usar una 
MT para enumerar cadenas. 

Definición 5.6 Un lenguaje L es Turing-enumerable o simplemente enumerable si existe 
una MT M = (K, E, S, s) y un estado q e K tal que 


L 


{we(E- {#})*, 3u G E*, (a, #) h* M (q, #«;#«)} 
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Esto significa que M se arranca en la cinta vacía y va dejando las cadenas de L en la cinta, 
una por vez, pasando por q para indicar que ha generado una nueva cadena, y guardando 
luego del cabezal la información necesaria para continuar generando cadenas. Nótese que se 
permite generar una misma cadena varias veces. 

Lema 5.9 Un lenguaje L es enumerable sii es aceptable. 

Prueba: Si L es aceptado por una MT M, podemos crear una MTND que genere todas las 

cadenas posibles w. Una vez generada una cadena w no determinísticamente, la copia a la cinta 2 
y corre M sobre ella. En caso de que M termine, la simulación de la MTND no se detiene como 
en el caso usual, sino que almacena las directivas (recordar Sección 4.5) luego de jfwjf en la cinta 
1, y recién retoma la simulación de la MTND. 

Si L es enumerado por una MT M, es fácil aceptarlo. Dada una w en la cinta 1, corremos M 
en la cinta 2. Cada vez que A I genera una nueva cadena w' pasando por su estado q, comparamos 
w con w' y nos detenemos si w = w', sino retomamos la ejecución de AI. □ 

Finalmente, estamos en condiciones de establecer la relación entre GDCs y MTs. 

Teorema 5.3 Un lenguaje L es generado por una GDC sii es aceptable. 

Prueba: Primero veamos que si L es generado por una GDC, entonces es enumerable (en vez de 
aceptable). Esto es prcticamente lo que hicimos en el Teo. 4.2, mostrando que existe una MTND 
que produce cada cadena de L a partir de la cinta vacía. Cada vez que esta MTND genere una 
cadena, pasamos por un estado especial q y detrs de la cadena almacenamos la informacin necesaria 
para continuar la simulacin (por ejemplo el contenido de las cintas). 

Inversamente, si L es aceptable, entonces es el lenguaje de salida de una MT AI. Podemos 
construir una GDC G que genere las cadenas de ese lenguaje de salida de la siguiente forma. 
Primero generamos cualquier configuración posible de comienzo con S — > \fiC], C —> aC para 
cada a € £ — {#}, y C —> sff. Luego, agregamos a la GDC las reglas que le permiten simular M 
(Lema 4.4), de modo que (s, ffuff) \~* M (h, jfwffi) sii [fjusfij [ffwhff\. Con esto G será capaz 

de generar todas las cadenas [ffwhjf\ tal que w € L. Finalmente, eliminamos los terminadores de 
la cadena con unas pocas reglas adicionales: hjf\ —> X , aX —> Xa para todo a € E — {#}, y 
[#X —► e. □ 

5.3 Demostrando Indecidibilidad por Reducción 

En esta sección veremos cómo se puede usar la indecidibildad del problema de la detención 
para demostrar que otros problemas también son indecidibles. 

La herramienta fundamental es la reducción. Si tengo un problema A que quiero probar 
indecidible, y otro B que sé que es indecidible, la idea es mostrar cómo, con una MT que 
decidiera A, podría construir una que decidiera B. Diremos que reducimos el problema B 
(que sabemos indecidible) al problema A (que queremos probar indecidible), estableciendo, 
intuitivamente, que A no es más fácil que B. 

Probaremos primero varios resultados de indecidibildad sobre MTs. 



5.3. DEMOSTRANDO INDECIDIBILIDAD POR REDUCCION 


121 


Lema 5.10 Los siguientes problemas sobre MTs son indecidibles: 

1. Dadas M y w, ¿M se detiene frente a w? 

2. Dada M, ¿se detiene arrancada con la cinta vacía? 

3. Dada M, ¿se detiene frente a alguna/toda entrada posible? 

4- Dadas M\ y M 2 , ¿se detienen frente a las mismas cadenas? Es decir, ¿aceptan el 
mismo lenguaje? 

5. Dadas Mi y AL 2 que calculan funciones, ¿calculan la misma función? 

6. Dada AL, ¿el lenguaje que acepta AL es finito? ¿regular? ¿libre del contexto? 
¿decidible? 

Prueba: 

1. Es exactamente lo que probamos en el Teo. 5.1. 

2. Supongamos que pudiéramos decidir ese problema. Entonces, para decidir 1. con M y w, 
crearíamos una nueva AL' = t>w;i > w 2 ■ ■ ■ O iui^i > M. Esta AL' , arrancada en la cinta vacía, 
primero escribe w y luego arranca M, de modo que AL' termina frente a la cinta vacía sii M 
acepta w. 

3. Si pudiéramos decidir ese problema, podríamos resolver 2. para una MT M creando AL' = 
BAL (Def. 4.10), que borra la entrada y luego arranca AL sobre la cinta vacía. Entonces AL' 
se detiene frente a alguna/toda entrada sii M se detiene frente a la cinta vacía. 

4. Si pudiéramos decidir ese problema, podríamos resolver 3. para una MT AL, creando una AL¿ 
que nunca se detuviera frente a nada (ó(s,a) = ( s,a ) para todo a € S) y preguntando si 
Mi = AL se detiene frente a las mismas entradas que AL 2 (para el caso “se detiene frente a 
alguna entrada posible”; para el otro caso, la M 2 se debería detener siempre, ó(s, a) = (h, a)). 

5. Si pudiéramos decidir ese problema, podríamos resolver 1. para una MT M y una cadena 
w. Haríamos una M' a partir de (. M,w ) que calcule f(n) = 1 si AL acepta w en menos de 
n pasos, y f(n) = 0 sino. Es fácil construir AL' a partir de M, mediante simularla durante 
n pasos y responder. Ahora haremos una Mq que calcule fo(n) = 0 para todo n. Entonces 
AL se detiene frente a w sii AL' y Mq no calculan la misma función. Esto muestra que tampoco 
puede decirse si una función computable alguna vez entregará un cierto valor. 

6 . Si pudiéramos decidir ese problema, podríamos resolver 2. para una MT M, de la siguiente 
forma. Crearíamos una MT AL' que primero corriera AL en la cinta 2, y en caso de que AL 
terminara, corriera la MUT (Def. 4.23) sobre la entrada real de la cinta 1. Entonces, si AL 
no se detiene frente a la cinta vacía, AL' no acepta ninguna cadena (pues nunca llega a mirar 
la entrada, se queda pegada en correr AL en la cinta 2) y por lo tanto el lenguaje que acepta 
AL' es 0. Si M se detiene, entonces AL' se comporta exactamente como la MUT, por lo que 
acepta Kq. Podemos entonces saber si M se detiene o no frente a la cinta vacía porque 0 es 
finito, regular, libre del contexto y decidible, mientras que Kq no es ninguna de esas cosas. 
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□ 


Veamos ahora algunas reducciones relacionadas con GDCs. 

Lema 5.11 Los siguientes problemas sobre GDCs son indecidibles: 

1. Dadas G y w, ¿G genera w? 

2. Dada G, ¿genera alguna cadena? ¿genera toda cadena posible? 

3. Dadas G\ y G 2 , ¿generan el mismo lenguaje? 

4■ Dada G y w, z G {V U £)*, ¿w z? 

Prueba: 

1. Si esto fuera posible, tomaríamos cualquier lenguaje aceptable, construiríamos la GDC G que 
lo genera como en el Teo. 5.3, y podríamos decidir si una w dada está en el lenguaje o no. 

2. Si esto fuera posible, podríamos saber si una MT acepta alguna/toda cadena o no (punto 

3. en el Lema 5.10), mediante obtener nuevamente la GDC que genera el lenguaje que la MT 
acepta y preguntarnos si esa GDC genera alguna/toda cadena. 

3. Si esto fuera posible, podríamos saber si dos MTs aceptan el mismo lenguaje (punto 4. en 
el Lema 5.10), mediante obtener las GDCs que generan los lenguajes que las MT aceptan y 
preguntarnos si son iguales. 

4. Si esto fuera posible, podríamos saber si una MT M se detiene frente a la cinta vacía (punto 
2. en el Lema 5.10), mediante generar una M' que ejecute M en la cinta 2. Esta M' va de 
(s, jf) a (h, ff) sii M se detiene frente a la cinta vacía. Si ahora aplicamos la construcción del 
Lema 4.4, obtenemos una G que lleva de [s#] a [hff\ sii M se detiene frente a la cinta vacía. 

□ 


5.4 Otros Problemas Indecidibles 

Hasta ahora hemos obtenido problemas indecidibles relacionados con MTs y GDCs. Esto 
pnede ser lo más natural, pero es esperadle que podamos exhibir problemas indecidibles de 
tipo más general. 

Comencemos con un problema qne tiene semejanza con un juego de dominó. 

Definición 5.7 Un sistema de correspondencia de Post es un conjunto finito de pares P = 
{(wi,Ui), (u 2 , u 2 ),..., (u n , v n )}, con u^Vi G E + . El problema de correspondencia de Post 
es, dado un sistema P, determinar si existe una cadena w G E + (llamada solución,) tal que 
w = ííjjííjj.. .Ui k = Ví x Ví 2 ... Vi k para una secuencia i\, i 2 ,.. ., ik de pares de P a usar (los 
pares pueden repetirse). 
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Ejemplo 5.1 El problema de correspondencia de Post para el sistema P = 
{(ca, a), (a, aá), ( 6 , ca), (aftc, c)} tiene solución abcaaabc , que se obtiene utilizando los pares 
(a,ab),(b,ca),(ca,á),(a,ab),(abc,c): concatenando las primeras o las segundas componentes se 


obtiene la misma cadena. En este caso ¿1 = 
como fichas de dominó: 

2 , ¿2 = 

co 

-S3. 

CO 

= 1, i 4 

= 2 , : 

¿5 = 4. Es útil ver los pares 


ca 


a 


b 


abe 


a 

ab 

ca 

c 


donde buscamos pegar una secuencia de fichas de modo de que se lea la misma cadena arriba y 
abajo: 


a 

b 

ca 

a 

abe 

ab 

ca 

a 

ab 

c 


Una variante del problema, útil para demostrar varios resultados, es la siguiente, donde 
se fija cuál debe ser el primer par a usar. 

Definición 5.8 Un sistema de Post modificado es un par (P, (x, y)), donde P es un sistema 
de correspondencia de Post y (x,y) G P. El problema de Post modificado es encontrar una 
cadena w G E + tal que w = .. .Ui k = ... Vi k para una secuencia ¿i, ¿ 2 , .. . , ik, 

donde i\ corresponde a (x,y). 

Lo primero a mostrar es que resolver un sistema de Post no es más fácil que resolver uno 
modificado. 

Lema 5.12 Dado un sistema de Post modificado (P, (x,y)), podemos crear un sistema de 
Post P' tal que (P, (x,y)) tiene solución sii P' la tiene. 

Prueba: Debemos crear P' de manera de obligar a que ( x , y) sea el primer par utilizado. 

Definamos L(w) = *w\ * u >2 ■ ■ ■ * w\ w \ y R(w) = w\ * W 2 * ■ ■ ■ w\ w \ *. Comenzaremos insertando 
(L(x) *, L(y)), que será necesariamente el primer par a usar pues en todos los demás una cadena 
comenzará con * y la otra no. Para cada (u, v) G P (incluyendo (.x , y), que puede usarse nuevamente 
dentro), insertamos (R(u),L(v)) en P'. Para poder terminar la cadena, insertamos ($,*$) en P' . 
Los símbolos * y $ no están en E. Toda solución de P comenzando con (x,y) tendrá su solución 
equivalente en P' , y viceversa. □ 

El siguiente lema puede parecer sorprendente, pues uno esperaría poder resolver este 
problema automáticamente. 
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Teorema 5.4 El problema de correspondencia modificado de Post es indecidible, y por lo 
tanto el original también lo es. 

Prueba: Supongamos que queremos saber si w =><b z para una GDC G = (V, £, R, S) y cadenas 
w, z cualquiera, con la restricción de que u —> v € R implica v e. Crearemos un sistema de Post 
modificado que tendrá solución sii w =^* G z. Como esto último es indecidible por el Lema 5.11 
(donde las G para las que lo demostramos efectivamente no tienen reglas del tipo u —> s), los 
sistemas de Post son indecidibles en general también. 

En este sistema, de alfabeto V U £ U {*}, tendremos un par inicial (x,y) = (*,*w*), donde 
* 0 V U £. Tendremos asimismo todos los pares (a, a), a £ V U £ U {*}, y también los (u,v), 
u —> v € R. Finalmente, tendremos el par ( 2 **,*). 

Es fácil ver que existe una secuencia de derivaciones que lleva de w a z sii este sistema modificado 
tiene solución. La idea es que comenzamos con w abajo, y luego la “leemos” calzándola arriba y 
copiándola nuevamente abajo, hasta el punto en que decidimos aplicar una regla u — > v. Al 
terminar de leer w, hemos creado una nueva w' abajo donde se ha aplicado una regla, w => w'. 
Si terminamos produciendo z, podremos calzar la cadena completa del sistema de Post. □ 

Ejemplo 5.2 Supongamos que queremos saber si S aaabbb , donde las reglas son S — > aSb 
y S —> ab. El sistema de Post modificado asociado es 

P = {{*,*S*), (a, a), (b, b), (*,*), (S,aSb), (S,ab), (aaabbb**, *)} 

y (x,y) = (*,*S*). El calce que simula la derivación, escribiendo los pares con la primera 
componente arriba y la segunda abajo, es 


* 

s 

* 

a 

S 

b 

* 

a 

a 

S 

b 

b 

* 

aaabbb * * 

*s* 

aSb 

* 

a 

aSb 

b 

* 

a 

a 

ab 

b 

b 

* 

* 


donde, por ejemplo, para cuando logramos calzar el *S* de abajo con las cadenas de arriba, ya 
hemos generado aSb* abajo para calzar. Ilustra ver la misma concatenación de fichas, ahora 
alineando las secuencias. 

*|S|*|a|S|6|*|a|a|S|6|6|*|a a a b b b * * 

* S * | a S b | * | a | a S b\b\*\a\a \ a b\b\b\*\* 

El hecho de que los sistemas de Post sean indecidibles nos permite, mediante reducciones, 
demostrar que ciertos problemas sobre GLCs son indecidibles. 

Teorema 5.5 Dadas dos GLCs G\ y G 2 , es indecidible saber si C(G 1 ) D C(G 2 ) = 0 o no. 

Prueba: Podemos reducir la solución de un sistema de Post a este problema. Sea P = 

{(iti, v\), (u 2 , v 2 ), ■ ■ ■, ( u n , v n )} nuestro sistema, sobre un alfabeto £. Definiremos G\ = ({Si}, £ U 
{c},i?i,Si), con c 0 £ y R\ conteniendo las reglas Si —> ufS\Vi \ ufcvi para 1 < i < n. Por 




5.4. OTROS PROBLEMAS INDECIDIBLES 


125 


otro lado, definiremos G 2 = ({S' 2 }, £ U {c}, R 2 , S 2 ), con R 2 conteniendo S 2 —> aS 2 d para todo 
a € E y S 2 —> c. Entonces C(GR) = {uf n ... u^u^cv^Vi 2 ... v ik , k > 0, 1 < h, i 2 , ■ ■ ■ ,ik < n} y 
L{G 2 ) = {w R cw, w G E*}. Está claro que P tiene solución sii C(G\) y C(G 2 ) tienen intersección. 
□ 


Otro problema importante en GLCs es determinar si una G es ambigua (Def. 3.7). Este 
problema tampoco es decidible. 

Teorema 5.6 Dada una GLC G, es indecidible saber si G es ambigua. 

Prueba: Podemos reducir la solución de un sistema de Post a este problema. Sea 

P = {(ui,ui), (u 2 , V 2 ), ■ ■ ■, (u n , v n )} nuestro sistema, sobre un alfabeto E. Definiremos G = 
({5, Si, S' 2 }, S U {ai, ü 2 , ■ ■ ■, a n }, R, S), con a¿ 0 E y R conteniendo las reglas S —¿>1 | S' 2 , 
Si —> aiS\Ui | üíUí para cada i, y S 2 —> a¿S 2 U¿ | para cada i. De Si, entonces, se generan 
todas las cadenas de la forma a¿ fc ... a l2 ai 1 u ll Ui 7 .. .Ui k , mientras que de S 2 se generan todas las 
cadenas de la forma a¿ fc ... a l2 ai 1 v ll Vi 2 ... v lk . Está claro que G es ambigua sii hay una forma de 
generar una misma cadena, usando los mismos pares, mediante las it’s y mediante las v’s, es decir, 
si P tiene solución. □ 

Finalmente, volveremos a utilizar MTs para demostrar que el siguiente problema, de 
encontrar una forma de embaldosar un piso infinito (o resolver un rompecabezas), no tiene 
solución algorítmica. 

Definición 5.9 Un sistema de baldosas es una tupia (. D , do, H, V), donde D es un conjunto 
finito, d 0 G D, y H,V C D x D. Un embaldosado es una función f : N x N —» D, 
que asigna baldosas a cada celda de una matriz infinita (pero que comienza en una esquina), 
donde f (0,0) = d 0 , y para todo m, n > 0, (f(n,m),f(n+l,m)) G V, (f(n,m),f(n,m+ 1)) G 

H. 


La idea es que H dice qué baldosas pueden ponerse a la derecha de qué otras, mientras 
que V dice qué baldosas pueden ponerse arriba de qué otras. 

Teorema 5.7 El problema de, dado un sistema de baldosas, determinar si existe un 
embaldosado, es indecidible. 

Prueba: La idea es definir un sistema de baldosas a partir de una MT M, de modo que M se 
detenga frente a la cinta vacía sii no existe un embaldosado. La fila i de la matriz corresponderá 
a la cinta de M en el paso i. Las baldosas tienen símbolos escritos en algunos de sus lados, y las 
reglas H y V indican que, para poner una baldosa pegada a la otra, lo que tienen escrito en los 
lados que se tocan debe ser igual. 

Las celdas de la primera fila son especiales: do es la baldosa de la izquierda, y las demás baldosas 
de la primera fila sólo podrán ser escogidas iguales a la baldosa de la derecha. 
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(s,#) 


# 

# 


# # 


d 0 

El lado superior (s, #) indica, además del carácter en la cinta, que el cabezal está en esa celda 
y el estado. Las celdas que están lejos del cabezal no cambian entre el paso i e i + 1. Para esto 
existen baldosas 


a 


a 


para cada a € £. Para poner la baldosa que va arriba de la del cabezal, las reglas dependerán 
del 6 de M. Si S(q, a) = (p, b ) con b £ E, tendremos una baldosa que nos permita continuar hacia 
arriba a partir de una baldosa rotulada (q, a ) en el borde superior: 


(P,b) 

(q,a) 


En cambio, si 6(q, a) = (p. <), necesitamos baldosas que nos permitan indicar que el cabezal se 
ha movido hacia la izquierda: 


a 


(P,b) 

(P,<) 


(P,<) 

(q,a) 


b 


para cada b G E, y similarmente para el caso 6(q, a) = (p, >): 
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a 


(P,b) 

(P>>) 


(P>>) 

(q,a) 


b 


Es fácil ver que, si M se detiene frente a la cinta vacía, entonces llegaremos en algún paso i a 
una celda con el borde superior rotulado (h, b) para algún b G £. Como no existe regla para poner 
ninguna baldosa sobre ésta, será imposible encontrar un embaldosado para este sistema. Si, en 
cambio, M corre para siempre, será posible embaldosar toda la matriz infinita. 


Notar que, si M se cuelga, el cabezal simplemente desaparecer de nuestra simulacin, y ser 
posible embaldosar el piso porque no ocurrirn rns cambios en la cinta. Esto es correcto porque la 
inquina no se ha detenido (sino que se ha colgado). □ 


Ejemplo 5.3 Supongamos una MT M con las reglas 8{s,jf) = ( q,a ), S(q,a ) = (p, D>), ó(p, #) = 
( p,a ), S(p,a ) = (/i, >). El embaldosado correspondiente a esta MT es el siguiente, donde queda 
claro que no se puede embaldosar el plano infinito: 
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Terminaremos este capítulo ilustrando la jerarquía de lenguajes que hemos obtenido. 
Esta se refinará en el próximo capítulo. 


No aceptables 
Aceptables 
Decidibles 



5.5 Ejercicios 

1. Un autómata finito universal es un autómata finito que recibe como entrada la 
codificación de un autómata finito y la de una cadena de entrada, es decir p(M)p(w), y 
se comporta sobre p(w) igual que como lo haría M. Explique por qué no puede existir 
un autómata finito universal. 

2. Muestre que la unión y la intersección de lenguajes Turing-aceptables es Turing- 
aceptable (aunque no el complemento, como vimos). 

3. Muestre que la unión, intersección, complemento, concatenación y clausura de Kleene 
de lenguajes Turing-decidibles es Turing-decidiblc. 

4. Muestre que cualquier conjunto finito es Turing-decidiblc. 

5. Muestre que L es Turing-aceptable si y sólo si, para alguna MTND M, L = {w E 

£*, (s, fifi \~* M (h, donde s es el estado inicial de M. 
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6. Sea E un alfabeto que no contiene la letra c. Suponga que L C {wicw 2 , wi,w 2 G E*} 
es Turing-aceptable. Muestre que 1/ = {uq, 3 w 2 , w\cw 2 G L} es Turing-aceptable. Si 
L es decicliblc, ¿necesariamente L' es decidible? 

7. Suponga que, para ahorrar espacio, quiere construir un algoritmo que minimice 
máquinas de Turing: dada una MT M, genera otra que acepta el mismo lenguaje pero 
tiene el menor número posible de estados. Dentro de las que tienen el menor número 
de estados, devuelve la que genera, lexicográficamente, la menor representación p(M'). 
Muestre que tal algoritmo no puede existir. 

8. ¿Cuáles de los siguientes problemas problemas se pueden resolver por algoritmo y cuáles 
no? Explique. 

(a) Dadas M y w , determinar si M alguna vez alcanza el estado q al ser arrancada 
sobre w a partir del estado s. 

(b) Dadas M, w y un símbolo a G E, determinar si M alguna vez escribe el símbolo 
a en la cinta, al ser arrancada sobre w a partir del estado s. 

(c) Dadas M\ y M 2 , determinar si hay una cadena w en la cual ambas se detienen. 

(d) Dada M, determinar si alguna vez mueve el cabezal hacia la izquierda, arrancada 
en el estado s sobre la cinta vacía. 

(e) Dada M, determinar si alguna vez llegará a una cierta posición n de la cinta. 

5.6 Preguntas de Controles 

A continuación se muestran algunos ejercicios de controles de años pasados, para dar una 
idea de lo que se puede esperar en los próximos. Hemos omitido (i) (casi) repeticiones, (¿i) 
cosas que ahora no se ven, (¿ii) cosas que ahora se dan como parte de la materia y/o están 
en los ejercicios anteriores. Por lo mismo a veces los ejercicios se han alterado un poco o se 
presenta sólo parte de ellos, o se mezclan versiones de ejercicios de distintos años para que 
no sea repetitivo. 

C2 1996 Responda verdadero o falso y justifique brevemente (máximo 5 líneas). Una 
respuesta sin justificación no vale nada aunque esté correcta, una respuesta incorrecta 
puede tener algún valor por la justificación. 

a) Si se pudiera resolver el problema de la detención, todo lenguaje aceptable sería 
decidible. 

b ) Si se pudiera resolver el problema de la detención, todos los lenguajes serían 
decidibles. 

c) Hay lenguajes que no son aceptables y su complemento tampoco lo es. 
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d) Dada una MT, hay un algoritmo para saber si es equivalente a un autómata finito 
(en términos del lenguaje que acepta). 

e) Si una MT se pudiera mover solamente hacia adelante y no escribir, sólo podría 
aceptar lenguajes regulares. 

C2 1996 Se tiene una función biyectiva y Turing-computable / : E* —* E*. 

Demuestre que la inversa / _1 : E* —y E* también es Turing-computable. La 
demostración debe ser precisa y suficientemente detallada para que no queden dudas 
de su validez. 

C2 1997 Sea M una máquina que recibe una cadena w y arranca la Máquina Universal de 
Turing (MUT) con la entrada wp[w). Se pregunta si M acepta la cadena p(M). 

a) Identifique, del material que hemos visto, qué lenguaje acepta M. 

b ) A partir de la definición del lenguaje que acepta M, ¿puede deducir la respuesta a 

la pregunta? Comente. 

c) Considere la máquina operacionalmente y lo que hará la MLIT cuando reciba su 

entrada y empiece a procesarla. ¿Puede responder ahora la pregunta? ¿La 
respuesta acarrea alguna contradicción con b)l Explique. 

C2 1997 Sea / una función de E* en E*, tal que $ ^ E. 

• Demuestre que si el lenguaje L = {u $ f(u), u G E*} es decidióle, entonces / es 
computablc. 

• Demuestre que si L es aceptable, / sigue siendo computable. 

ExRec 1997 LIn oráculo es un mecanismo (no necesariamente posible de construir) capaz 
de responder alguna pregunta indecidible. 

Suponga que tiene un oráculo capaz de decidir el problema de la detención, y lo 
considera como un mecanismo utilizable (es decir, el problema se hace de repente 
decidióle). Responda justificando brevemente (máximo 5 líneas). 

a) ¿Todos los lenguajes aceptables pasarían ahora a ser decidióles? ¿Quedarían 
lenguajes no decidióles? ¿Quedarían lenguajes no aceptables? 

b ) Las mismas preguntas anteriores si dispusiera (a su elección) de una cantidad 
numerable de los oráculos que necesite. 

c) Las mismas anteriores si la cantidad de oráculos pudiera ser no numerable. 
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Ex 1998 Considere una MT que calcula funciones a la cual, frente a la entrada w, se le 
permite realizar a lo sumo f(\w\) pasos, donde / es una función fija para la MT. Si 
para ese momento no terminó se supone que su respuesta es, digamos, la cadena vacía. 

Pruebe que con este tipo de máquinas no se pueden calcular todas las funciones Turing- 
computables. 

Ex 1999 Dibuje un diagrama de conjuntos para indicar las relaciones de inclusión e 
intersección de las siguientes clases de lenguajes: regulares (R), libres del contexto 
(LC), todos los complementos de L (CLC), recursivos (C), recursivos enumerables 
(RE) y todos los complementos de RE (CRE). Justifique brevemente. 

C1 2001 Un autómata de dos pilas permite operar sobre ambas pilas a la vez, y acepta una 
cadena cuando llega a un estado final, sin importar el contenido de las pilas. 

(a) Defina formalmente este autómata, la noción de configuración, la forma en que se 
pasa de una configuración a la siguiente, y el lenguaje que acepta. 

(b) Demuestre que los lenguajes aceptados por un autómata de dos pilas son 
exactamente los lenguajes Turing-aceptables. 

C2 2002 Sea Mi la MT que acepta el lenguaje AJ, mediante convertir la entrada p(M ) en 
p{M)p{p{M)) e invocar la MUT. 

(a) Determine si p(Mi ) G Afi o no. Explique su respuesta. 

(■ b ) Cualquiera haya sido su respuesta a la pregunta anterior, ¿es posible rediseñar M\ 
para que la respuesta cambie, y siga siendo válido que Mi acepta 

Considere la MGT del [Ex 2002] (página 110). 

¿Puede hacer una MT que acepte £(MGT) C ? Explique cómo o demuestre que no 
puede. 

¿Puede hacer una MT que decida si w G A(G)? Explique cómo o demuestre que 
no puede. 

Vuelva a responder la pregunta anterior suponiendo ahora que G es una gramática 
libre del contexto. 

Ex 2003, C2 2008 Argumente de la forma más clara posible, sin exceder las 5 líneas, por 
qué los siguientes problemas son o no son computables. 

(a) Dado un programa en C, determinar si es posible que una determinada variable se 
examine antes de que se le asigne un valor. 


Ex 2002 
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( b ) Dado un programa en C, determinar si es posible llegar a una determinada línea 

del código sin antes haber ejecutado una determinada función. 

(c) Dado un programa en C, determinar si es posible que termine antes de haber 

pasado más de una vez por alguna línea del programa (considere que se escribe a 
lo sumo un comando por línea). 

Se unieron preguntas similares de esos años. 

C2 2004 Se define la distancia de edición generalizada de la siguiente forma. Se da un 
conjunto finito de sustituciones permitidas (a,/3,c), con aj^/3ED*ycE M + 
el costo de la sustitución. Dada una cadena x, se le pueden aplicar repetidamente 
transformaciones de la forma: buscar un substring a y reemplazarlo por /3. El costo de 
una serie de transformaciones es la suma de los costos individuales. Dadas dos cadenas 
x e y, la distancia de edición generalizada de x a y es el mínimo costo de transformar 
x en y , si esto es posible, e infinito sino. 

Demuestre que la distancia de edición generalizada no es computable. 

Ex 2004 

(a) Demuestre que el problema de, dada una MT M, una entrada w, y un número k, 
saber si M llega a la h-ésima celda de la cinta frente a la entrada w, es decidible. 

(i b ) Demuestre que el problema de, dada una MT M y una entrada w, saber si llega 
a la h-ésima celda para todo k (es decir, no usa una porción finita de la cinta), 
no es decidible. 

(c) Un lenguaje es sensitivo al contexto si es generado por una gramática dependiente 
del contexto donde toda regla u —> v cumple |«| < |u| (por ejemplo, {á n b n c n , n > 
0} es sensitivo al contexto). Demuestre que los lenguajes sensitivos al contexto 
son Turing-decidibles. 

Ex 2005 De los siguientes productos ofrecidos por la empresa MediocreProducts, indique 
cuáles podrían, al menos en principio, funcionar de acuerdo a la descripción que se 
entrega, y cuáles no. Argumente brevemente. 

MediocreDebug !: Recibe como entrada el texto de un programa en Pascal e indica 
la presencia de loops o recursiones que, para alguna entrada al programa Pascal, 
no terminan. 

MediocreRegular !: Un sencillo lenguaje de programación pensado para producir 
parsers de lenguajes regulares. Permite variables globales escalares (no arreglos 
ni punteros), sin recursión. Hay un buffer de 1 carácter para leer la entrada, 
en la que no se puede retroceder. El software es un compilador que recibe 
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como entrada un programa escrito en MediocreRegular!, lo compila y produce un 
ejecutable que parsea un determinado lenguaje regular. ¡Con MediocreRegular! 
usted podrá parsear cualquier lenguaje regular! 

MediocreContextFree !: Un maravilloso lenguaje de programación pensado para 
producir parsers de lenguajes libres del contexto. Permite variables globales 
escalares (no arreglos ni punteros), sin recursión. Se usa de la misma forma que 
MediocreRegular !', ¡y le permitirá parsear cualquier lenguaje libre del contexto! 

Mediocre ContextFree! (Professional): Un completo lenguaje de programación 
para iniciados, con el mismo objetivo y forma de uso que MediocreContextFree!. 
El lenguaje ahora permite variables locales y recursión. Usted podrá parsear 
cualquier lenguaje libre del contexto, con más herramientas que 

Mediocre ContextFree! 

MediocreTuring !: Un editor gráfico de Máquinas de Turing, que incluye una 
herramienta simplificadora de máquinas. ¡Usted diseña su máquina y 

MediocreTuring! se la simplifica hasta obtener la menor máquina posible que 
acepta el mismo lenguaje que la que usted diseñó! 

C2 2006 Demuestre que el problema de, dadas dos Máquinas de Turing Mi y M 2 que 
computan funciones /i y f 2 de Eq en E*, determinar si f\ = / 2 es indecidible. 

Ayuda: considere la función /m(w$J") = S si M se detiene frente a w en a lo sumo n 
pasos, y N en otro caso. 

C2 2006 Demuestre que la unión e intersección de lenguajes Tnring-aceptables es Tnring- 
aceptable, pero no la diferencia. 

Ex 2006 Harta de recibir críticas por que sus programas se cuelgan, la empresa 
MediocreProdncts decide cambiar de lenguaje de programación para que sea imposible 
que tal cosa ocurra. En este nuevo lenguaje existen dos instrucciones de salto. Una es 
el if-then-else de siempre, y la otra es un while restringido: while (expr\) do sent 
max (expr 2 ) ejecutará sent mientras expr\ ^ o, pero a lo sumo expr 2 veces. Si luego 
de expr 2 iteraciones el while no ha terminado, el programa aborta dando un error 
(pero no se queda pegado jamás). Esta expr 2 debe evaluar a un entero positivo, y no 
se vuelve a evaluar luego de cada iteración, sino sólo al comienzo del while. 

Comente sobre el futuro de MediocreProducts cuando sus programadores sean 
obligados a usar este lenguaje. 

C2 2007 Un autómata linealmente acotado (ALA) es parecido a una MT, excepto porque 
sólo debe trabajar dentro de las celdas en qne vino originalmente la entrada, sin 
posibilidad de extenderse a las celdas blancas de la derecha. 

1. Muestre que puede reconocer L = {a n b n c n , n > 1} con un ALA. 
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2. Muestre que el problema de la detención tiene solución para este tipo de 
autómatas. 

3. ¿Los ALAs son equivalentes en poder a las MTs? Argumente. 

C2 2008 Considere un modelo de computación donde, si la MT se arranca sobre una entrada 
w, el espacio de cinta que tiene disponible para calcular es de f(\w\) celdas, donde 
f(n) > n + 2 es alguna función conocida. Si la MT trata de acceder rns allá en la cinta, 
se cuelga. 

1. Demuestre que, conociendo /, el problema de la detención es decidióle en este 
modelo. 

2. ¿Habrá una cierta / suficientemente generosa para la cual se puedan calcular 
todas las funciones computables en el modelo clásico? 

Ex 2008 Un 2-AFD es un autómata finito determinístico que tiene dos cabezales 
bidireccionales de solo lectura. Los cabezales empiezan en el lado izquierdo de la cinta 
de entrada y pueden moverse a cualquier dirección independientemente. La cinta de un 
2-AFD es finita y su tamaño es igual al largo de la entrada más dos celdas adicionales 
que almacenan delimitadores como el blanco de una MT. Un 2-AFD acepta su entrada 
si entra a un estado especial de aceptación. 

1. Defina formalmente el 2-AFD como una tupia de componentes; luego defina lo que 
es una configuración; cómo es una transición entre configuraciones; el concepto de 
aceptar o no una cadena; y finalmente defina el lenguaje aceptado por un 2-AFD. 

2. Aunque el problema de la detención en este modelo es decidibe demuestre que el 
lenguaje E = {(A)|A es un 2-AFD y L(A) = 0} es no decidióle. 


5.7 Proyectos 

1. Investigue sobre funciones recursivas primitivas y /i-recursivas como modelo alternativo 
de computación, esta vez con énfasis en el tema de la terminación. Una fuente es [LP81, 
sec. 5.3 a 5.6]. 

2. Investigue sobre otras preguntas incleciclibles sobre GLCs. Lina fuente es [Kcl95, 
pág. 261 a 263], otra es [HMU01, sec. 9.5.2 a 9.5.4], 

3. Investigue sobre oráculos y grados de indecidibilidad. Lina fuente es [DW83, cap. 5]. 

4. Investigue sobre la complejidad de Kolmogorov y su relación con la computabilidad. 
Lina fuente es [LV93]. 

5. Lea otros libros más de divulgación, pero muy entretenidos, sobre computabilidad, por 
ejemplo [Hof99] o [PG02], ¿Es algorítmico nuestro pensamiento? 
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Capítulo 6 

Complejidad Computacional 


[LP81, cap 7], [AHU74, cap 10 y 11] 

En este capítulo nos preocuparemos por primera vez del tiempo que demora una MT en 
calcular una función o decidir un lenguaje. Todos los problemas que consideraremos serán 
decididles, pero trataremos de distinguir, dentro de ellos, cuáles son más “fáciles” que otros. 

Nuevamente identificaremos decidir lenguajes (saber si una cadena está en un conjunto) 
con resolver problemas de decisión, es decir responder sí o no frente a una entrada. 

6.1 Tiempo de Computación [lpsi, sec 7 . 1 ] 

Comenzaremos definiendo el tiempo de una computación basándonos en el número de 
pasos que realiza una MT. 

Definición 6.1 Una computación de n pasos de una MT M es una secuencia de 
configuraciones C 0 \~ M C\ \~ M C 2 ■ ■ ■ \~ M C n . Diremos que C 0 lleva en n pasos a C n y 
lo denotaremos Cq \~ v m C n . 

Definición 6.2 Diremos que M = (Jí, E,<5, s) calcula f{w) en n pasos si \- n M 

(h,#f(w)±). 

Dada una MT M que calcula una cierta función /, queremos dar una noción de cuánto 
tiempo le toma a M calcular /. Decir cuánto demora para cada entrada w posible da más 
detalle del que nos interesa. Lo que quisiéramos es dar el tiempo en función del largo de 
la entrada. Un problema es que distintas entradas del mismo largo pueden requerir una 
cantidad de pasos distinta. Lo que usaremos será la noción de peor caso de algoritmos: nos 
interesará el mayor tiempo posible dentro de las entradas de un cierto largo. 

Definición 6.3 Diremos que M computa / : Eq —> EJ en tiempo T(n) si, para cada 

w e Eq, M calcula f(w) en a lo sumo T(|w|) pasos. Similarmente, diremos que M decide 
L en tiempo T(n) si M calcula en tiempo T(n) (ver Def. j-7). 
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Es interesante que hay un mínimo de pasos en el que se puede decidir un lenguaje. 

Lema 6.1 No es posible decidir un lenguaje en tiempo menor a T(n) = 2n + 4. 

Prueba: Sólo para retroceder desde la configuración jfwjf borrando la entrada hasta detectar el 
comienzo de la cinta se necesitan 2n + 1 pasos. Luego se necesitan a lo menos 3 pasos más para 
escribir S o N y posicionarse en la siguiente celda. □ 

Ejemplo 6.1 Una MT que decide L = {w G {a, b}*, w tiene una cantidad impar de b's } (recordar 
Ej. 2.7) puede ser como sigue (en notación no modular). 

b,# 

b,# 





Es fácil ver que esta MT requiere siempre 2n + 4 pasos para una entrada de largo n. 

Observación 6.1 Es fácil darse cuenta de que cualquier lenguaje regular se puede decidir 
en tiempo 2 n + 4, mediante modificar sistemáticamente el AFD que lo reconoce para que 
lea la cadena al revés, la vaya borrando, y luego escriba S o N según haya quedado en un 
estado final o no. ¿Qué pasa con los libres del contexto? Por otro lado, sí es posible calcular 
funciones más rápidamente: la función identidad se calcula en un sólo paso. 

Ejemplo 6.2 Bastante más complicado es calcular el tiempo que tarda la MT del Ej. 4.10 en 
decidir su lenguaje. Un análisis cuidadoso muestra que, si w € L, el tiempo es n 2 /2 + 13n/2, donde 
n = |uj, pero puede ser bastante menor (hasta 2 n + 6) si w 0 L. 

En general, determinar la función exacta T(n) para una MT puede ser bastante difícil ¡De 
hecho no es computable siquiera saber si terminará!. Veremos a continuación que, afortunadamente, 
es irrelevante conocer tanto detalle. 
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6.2 Modelos de Computación y Tiempos [lpsi, sec 7.3] 

Hasta ahora nos hemos mantenido en el modelo de MTs determinísticas de una cinta. 
Veremos a continuación que los tiempos que obtenemos son bastante distintos si cambiamos 
levemente el modelo de computación. Esto nos hará cuestionarnos cuál es el modelo que 
realmente nos interesa, o si podemos obtener resultados suficientemente generales como para 
que estas diferencias no importen. De aquí en adelante necesitaremos usar la Jiotación O. 

Definición 6.4 Se dice que f(n ) es 0(g(n)), para f y g crecientes, si existen constantes 
c, no > 0 tal que, para todo n > no, f(n) < c ■ g(n). 

Esto nos permite expresar cómodamente, por ejemplo, que el tiempo que toma una 
función es alguna constante multiplicada por n 2 , diciendo que el tiempo es 0(n 2 ). Asimismo 
nos permite eliminar detalle innecesario, pues por ejemplo n 2 + 2n — 3 = 0(n 2 ). 

Volvamos ahora al tema de la dependencia del modelo de computación. 

Ejemplo 6.3 Recordemos la MT del Ej. 4.7, que calculaba f(w) = ww R . Si se analiza 
cuidadosamente se verá que esa MT demora tiempo T(n) = 2 n 2 + 4n. Consideremos ahora la 
siguiente MT de 2 cintas. 



Analizándola, resulta que su T(n ) = 5n + 3. Por otro lado, se puede demostrar que es imposible 
obtener un T(n) subcuadrático usando una sola cinta. 

Esto significa que, según el modelo de MT que usemos, el tiempo necesario para calcular 
una función puede variar mucho. Lo único que podemos garantizar acerca de la relación 
entre MTs de 1 y de k cintas es lo siguiente. 

Lema 6.2 Sea una MT M de k cintas que requiere tiempo T(n) > n para calcular una 
función f. Entonces, existe una MT de una cinta que calcula f en tiempo 0(T(n) 2 ). 
Prueba: Nos basamos en una variante de la simulación de MTs de k cintas vista en la Sección 4.4. 
Esta variante es más compleja: en vez de hacer una pasada buscando cada cabezal, hace una única 
pasada recolectando los caracteres bajo los cabezales a medida que los va encontrando. Luego 
vuelve aplicando las transformaciones a la cinta. En tiempo T(n) la MT de k cintas no puede 
alterar más de n + T{n ) < 2 T(n) celdas de la cinta, de modo que la simulación de cada uno de 
los T(n ) pasos nos puede costar un recorrido sobre 2 T{n) celdas. El costo total es de la forma 
0(T(n) 2 ). En [LP8Í, sec 7.3] puede verse la fórmula exacta. □ 
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Si, por ejemplo, usamos una MT de cinta doblemente infinita, la podemos simular en 
tiempo 6 T(ri) + 3n + 8. Si usamos una MT de cinta bidimensional, la podemos simular en 
tiempo 0(T(n) 3 ). Una simulación particularmente importante es la siguiente. 

Lema 6.3 Sea una máquina RAM que requiere tiempo T(n) para calcular una función f. 
Entonces, existe una MT de una cinta que calcula f en tiempo 0(T(n) 2 ). 

Prueba: Nos basamos en una variante de la simulación de máquinas RAM de la Sección 4.7. Esa 
simulación usaba 2 cintas. Hacerlo con una cinta es un poco más engorroso pero posible y no afecta 
el tiempo cuadrático que obtendremos. Nuevamente, la máquina RAM no puede escribir más de 
T(n) celdas distintas en tiempo T(n), y por ello la búsqueda de las celdas secuencialmente en la 
cinta 1 no puede demorar más de 0(T(n)). Sumado sobre todas las T(n) instrucciones a simular, 
tenemos O (T (n) 2 ). Es cierto que las celdas representadas en la MT pueden tener largo variable, pero si las 
representamos en binario en vez de unario el total de bits necesario será similar al de las máquinas RAM, 
a las que por otro lado es usual cobrarles tiempo proporcional a la cantidad de bits que manipulan. □ 

Si queremos establecer resultados suficientemente generales como para que se apliquen 
a otros modelos de computación razonables (en particular las máquinas RAM), no deberá 
importarnos mucho la diferencia entre n 2 y n 4 . Esto parece bastante decepcionante, pero no 
debería. Un resultado que obtengamos en un modelo tan permisivo será muy fuerte y muy 
general, y de hecho obtendremos resultados que se podrán trasladar directamente al modelo 
RAM. 

Existe un modelo que hemos dejado de lado: las MTNDs. Hay dos buenas razones para 
ello. Una es que, a diferencia de los modelos anteriores, no sabemos cómo construir MTNDs 
reales. Otra es que es mucho más costoso simular una MTND con una MTD. Esta diferencia 
es central en la teoría de complejidad computacional. 

Las MTNDs no calculan funciones, sólo aceptan lenguajes, por lo que requieren una 
definición adecuada. 

Definición 6.5 Una MTND M = (K,E,A,s) acepta un lenguaje L en tiempo T(n) si, 
para toda w e (E — {#})*, M se detiene frente a w en a lo sumo T(\w\) pasos sii w £ L. 

Observación 6.2 Recordemos que seguimos dentro de los lenguajes decidibles, y hemos 
tenido que hablar de aceptar por un tecnicismo. Si una MTND M acepta L en tiempo 
T(n), para cualquier T(n), entonces L es decidible: Basta correr M durante T(|w|) pasos. 
Si para entonces no se detuvo, w jL L. 

Lema 6.4 Sea M una MTND que acepta L en tiempo T(n). Entonces existe una MTD que 
decide L en tiempo c T(jl \ para alguna constante c. 

Prueba: Consideremos una variante de la simulación vista en la Sección 4.5, que limpie la cinta 
y responda S si la MTND se detiene antes de la profundidad T(n) + 1 en el árbol, o limpie la 
cinta y responda N si llega a la profundidad T(n) + 1 sin detenerse. Esta simulación tiene un costo 
exponencial en T(n), donde la base depende de la aridad del árbol. □ 
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6.3 Las Clases V y AÍV [lpsi, sec 7.4 y 7 . 5 ] 

La sección anterior nos muestra que, dentro de los modelos de computación razonables 
(que excluyen las MTNDs), los tiempos de cómputo están relacionados polinomialmente. 
Para obtener resultados suficientemente generales, definiremos una clase de problemas 
“fáciles” y otro de “difíciles” que abstraiga del modelo de computación. 

Definición 6.6 La clase V es el conjunto de todos los lenguajes que pueden decidirse en 
tiempo polinomial con alguna MTD (es decir, T(n) es algún polinomio en n). La clase AÍV 
es el conjunto de todos los lenguajes que pueden aceptarse en tiempo polinomial con alguna 
MTND. 

LIn lenguaje en V se puede resolver en tiempo polinomial usando MTs de una cinta, k 
cintas, cintas bidimensionales, máquinas RAM, etc. Un lenguaje en J\fV puede resolverse en 
tiempo polinomial usando MTNDs. En cierto sentido, V representa la clase de problemas 
que se pueden resolver en tiempo razonable con las tecnologías conocidas. 

Es evidente que V C AÍV. La vuelta, es decir la pregunta ¿V = AÍVl es el problema 
abierto más importante en computación teórica en la actualidad, y ha resistido décadas de 
esfuerzos. Resolver si V = AÍV equivale a determinar que, dada una MTND, hay siempre 
una forma de simularla en tiempo polinomial, o que hay MTNDs para las cuales eso no es 
posible. 

Observación 6.3 Es interesante especular con las consecuencias de que V fuera igual a 
AÍV. Hay muchos problemas difíciles que se resuelven fácilmente en una MTND mediante 
“adivinar” una solución y luego verificarla. Por ejemplo, se podrían romper los sistemas 
criptográficos mediante generar una clave no determinísticamente y luego correr el algoritmo 
(eficiente) que verifica si la clave es correcta. Hoy en día pocos creen que V pueda ser igual a 
AÍV, pero esto no se ha podido demostrar. Pronto veremos por qué todos son tan escépticos. 

LIn paso fundamental hacia la solución del problema es la definición de la clase de 
problemas NP-completos. Para explicar lo que son estos problemas debemos comenzar con 
el concepto de reducción polinomial. 

Definición 6.7 Un lenguaje L' C Eq reduce polinomialmente a otro lenguaje L C E* ; 
denotado L' < L, si existe una función f : Eq —y E* computable en tiempo polinomial en 
una MTD, tal que w G L' <=? f(w ) G L. 

Esto indica que, en cierto sentido, L' no es más difícil que L (si todo lo polinomial nos 
da lo mismo), pues para resolver L' basta aplicar / a la entrada y resolver L. 

Lema 6.5 Si L' < L y L EV, entonces L' e V. 

Prueba: Para determinar si w € L', aplico la MTD que computa f{w ) (en tiempo polinomial 
T f (\w\)), y a eso le aplico la MTD que decide L en tiempo polinomial T(n ). El tiempo que tomará 
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el proceso completo es Tf(\w\) + T(|/(it;)|). Como / se calcula en tiempo Tf(\w\), en ese tiempo es 
imposible escribir una salida de largo mayor a Tf(\w\), por lo tanto \ f(w)\ < |tc| + Tf(\w\), lo cual 
es un polinomio en |u;|, y también lo será al componerlo con otro polinomio, T(-). □ 

Como es de esperarse, esta relación < es transitiva. 

Lema 6.6 Si L" < L' y L' < L, entonces L" < L. 

Prueba: Sea / la reducción polinomial de L" a L' y g la de L' a L. Sean Tf(n ) y T g (n ) sus 
tiempos de cómputo. Entonces h(w) = g(f(w)) reduce polinomialmente de L" a L. Por un lado, 
w G L" f(w) G L' 4» g(f{w)) G L. Por otro, el tiempo de aplicar g{f{w)) es Tf(\w\)+T g (\f(w)\). 
Ya hemos visto en el Lema 6.5 que esto es necesariamente polinomial en |w;|. □ 

Los problemas NP-completos son, en cierto sentido, los más difíciles dentro de la clase 

AÍV. 

Definición 6.8 Un lenguaje L es NP-completo si (a) L G AÍV, ( b ) VI/ G AÍV, L' < L. 

El siguiente lema muestra en qué sentido los problemas NP-completos son los más difíciles 
de AÍV. 

Lema 6.7 Si L es NP-completo y L GP, entonces V = AÍV. 

Prueba: Sea un L' G AÍV. Como L es NP-completo, entonces L' < L, y si L G V, por el Lema 6.5, 
L' G V. □ 

Observación 6.4 Esto significa que si se pudiera resolver cualquier problema NP-completo 
en tiempo polinomial, entonces inmediatamente todos los problemas AÍV se resolverían en 
tiempo polinomial. Se conocen cientos de problemas NP-completos, y tras décadas de esfuerzo 
nadie ha logrado resolver uno de ellos en tiempo polinomial. De aquí la creencia generalizada 
de que V AÍV. 

Nótese que todos los problemas NP-completos son equivalentes, en el sentido de que 
cualquiera de ellos reduce a cualquier otro. Pero, ¿cómo se puede establecer que un problema 
es NP-completo? La forma estándar es demostrar que algún problema NP-completo es “más 
fácil” que el nuestro (el problema de cómo se estableció el primer problema NP-completo se 
verá en la próxima sección). 

Lema 6.8 Si L' es NP-completo, L G AÍV, y L' < L, entonces L es NP-completo. 

Prueba: Como L' es NP-completo, L" < IJ para todo L" G AÍV. Pero L' < L, entonces por 
transitividad (Lema 6.6) L" < L. □ 

Observación 6.5 En la práctica, es bueno conocer un conjunto variado de problemas NP- 
completos. Eso ayudará a intuir que un problema dado es NP-completo, y también qué 
problema NP-completo conocido se puede reducir a él, para probar la NP-completitud. Si 
un problema es NP-completo, en la práctica no es esperable resolverlo eficientemente, por 
lo que se deberá recurrir a algoritmos aproximados, probabilísticos, o meras heurísticas para 
tratarlo. 
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6.4 SAT es NP-completo [AHU 74 , sec 10 . 4 ] 

Lo que hemos visto nos entrega herramientas para mostrar que un problema es NP- 
completo mediante reducir a el otro problema que ya sabemos que es NP-completo. Pero, 
¿cómo obtenemos el primer problema NP-completo? No es fácil, pues debemos demostrar 
que cualquier problema NP reduce a él. 

El lenguaje que elegiremos como nuestro primer problema NP-completo se llama SAT. 

Definición 6.9 El lenguaje SAT es el de las fórmulas proposicionales satisfactibles, es decir, 
aquellas que es posible hacer verdaderas con alguna asignación de valor de verdad a sus 
variables. Permitiremos los paréntesis, la disyunción V, la conjunción A, y la negación ~. 
Los nombres de las variables proposicionales serán cadenas sobre algún alfabeto de letras, 
aunque por simplicidad pensaremos en letras individuales (no hará diferencia). Llamaremos 
literales a variables o variables negadas, conjunciones a fórmulas de la forma P\ A ... A P q 
y disyunciones a fórmulas de la forma P\ V ... V P q . 

Observación 6.6 Si una fórmula P tiene una cantidad pequeña k de variables 
proposicionales distintas, se puede probar una a una las 2 k combinaciones de valores de 
verdad y ver si alguna combinación hace P verdadera. El problema es que k puede ser 
cercano al largo de P, con lo cual este método toma tiempo exponencial en el largo de la 
entrada. 

Ejemplo 6.4 Considere la fórmula 

(p V ~ q V r) A (~ p V g V ~ r) A (~pV~g V r ) A (p V ~ q V ~ ?’) 

A (~pV~(/V~r)A(pVg , Vr) 

¿Es satisfactible? Toma algo de trabajo, pero sí lo es, con las asignaciones p = 0, g = 0yr = l, o 
p = l, g = 0yr = 0 (estamos escribiendo 1 para verdadero y 0 para falso). 

Para mostrar que SAT es NP-completo, debemos comenzar mostrando que SAT G A ÍV. 
Esto es evidente: Una MTND puede adivinar los valores a asignar a las variables y luego 
evaluar la fórmula en tiempo polinomial. 

La parte compleja es mostrar que todo L G AÍV reduce a SAT. La idea esencial es que, 
si L G AÍV, entonces existe una MTND M = (K, E, A,s) que se detiene en tiempo p(|tc|) 
o menos sii w G L, donde p(n) es un polinomio. A partir de M, w y p, construiremos una 
fórmula preposicional P que será satisfactible sii M se detiene frente a w en a lo sumo p(n) 
pasos. Esta construcción Ím, p {w) = P ser á nuestra función /, por lo que debemos cuidar 
que P tenga largo polinomial en |w| y que se pueda escribir en tiempo polinomial. 

La fórmula P debe expresar todo el funcionamiento de una MTND, incluyendo 
afirmaciones que nosotros mismos hemos obviado por ser intuitivas. Comenzaremos con 
un par de simplificaciones y observaciones para lo que sigue. 
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• Como la MTND arranca en la configuración (s, #w#), en p(|w|) pasos sólo puede llegar 
a la celda número p'(w) — |w| + 2 + p(|w|), el cual también es un polinomio en |w|. 

• Modificaremos la MTND M para que, si llega al estado h en un paso anterior a p(\w\), 
se mantenga en ese estado de ahí en adelante. De este modo w € L sii M está en el 
estado h en el paso p(|w|). No es difícil de hacer esta modificación: basta agregar las 
reglas ( h , a, h, a) a A, para todo a £ E (notar que esto no está realmente permitido en 
el formalismo, pero lo podemos hacer, incluyendo el estado h como el cero). 

Utilizaremos las siguientes variables preposicionales en P. De ahora en adelante 
llamaremos n = |w|, y renombraremos E = {1, 2,..., |E|} y K = {0, 1, 2,..., \K\}. 

• C(i, j, t), para cada 1 < i < p'(n), 1 < j < |E|, 0 < t < p(n), se interpretará como que 
en la celda i, en el paso t, está el carácter j. 

• H(i, t ), para cada 1 < i < p'(n), 0 < t < p(n), se interpretará como que el cabezal está 
en la celda i en el paso t. 

• S(k,t), para cada 0 < k < \K\, 0 < t < p(n), se interpretará como que la MTND está 
en el estado k en el paso t. 

La cantidad de variables proposicionales es 0(p'(n) 2 ) (pues K y E son constantes, siempre 
nos referimos al largo de w). Como tenemos que usar un alfabeto fijo para los nombres de 
variables, realmente los largos que reportamos a continuación deben multiplicarse por algo 
del tipo logp'(n) = O(logn), lo cual no afecta su polinomialidad. 

La fórmula P tiene siete partes: 

p = aabacadaeafag 

cada una de las cuales fija un aspecto de la computación: 


A: El cabezal está exactamente en un lugar en cada paso de una computación. 

A = A u ( H (l,t), H(p'(n),t)). 

0<t<p(n) 

Hemos usado la notación U para indicar que uno y sólo uno de los argumentos debe 
ser verdadero, es decir, 


U(x i,x 2 , ...,x r ) 



Como el largo de U es 0(r 2 ), el largo de A es 0(p'(n) 3 ). 
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B: Cada celda contiene exactamente un símbolo en cada paso de una computación. 

B = /\ U(C(i,l,t), 

l<¿<p'(n) 

0<t<p(n) 


cuyo largo es 0(p'(n) 2 ). 

C: La MTND está exactamente en un estado en cada paso de una computación. 

C = /\ U(S(0,t), S(l,t),..., S(\K\,t)), 

0 <t<p(n) 

cuyo largo es 0(p'(n)). 

D: La única celda que puede cambiar entre un paso y el siguiente es aquella donde está el 
cabezal. 

D = f\ (. H(i,t ) V (C(i,j,t) = C(i,j,t + 1)), 

l<i<p'(n) 

1<1<|S| 

0 <í<p(n) 

donde hemos abreviado x = y para decir (x A y) V (~ x A ~ y). El largo de D es 
0(p'(n) 2 ). 

E: Recién aquí empezamos a considerar la M específica, pues lo anterior es general para 
toda MT. En E se especifica lo que ocurre con la posición del cabezal y el contenido 
de la cinta en esa posición en el siguiente instante de tiempo, según las opciones que 
dé el A de M. 

= A (■ c(i,j,t ) A H(i,t) A S(k,t)) =► 

V(k,j,k t ,b e )e a(^(ÁÍa ¿ + 1) A H(ie,t + 1) A S(ke,t + 1)), 

1<Í<|S| 

0<fc<|X| 

0 <t<p(n) 

donde x y es una abreviatura para ~ x V y. Los valores j¿ e i¿ son función de b¿: 

• Si b £ e E, i t = i y je = b¿. 

• Si b¿ — <3, = i — 1 y j¿ — j Esta regla se agrega sólo si i > 1. 

• Si be = >, it = i + 1 y je = j- 

El tamaño de E es 0(p'(n) 2 ). Nótese cómo aparece el no detcrminismo aquí. Dada 

una P que afirma algo para cierto t, para el tiempo t + 1 vale la disyunción de varias 
posibilidades, según la MTND. 
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F: Establece las condiciones en que comienza la computación. 

F = S(s, 0) A H(n+2, 0) A (7(1, jf, 0) A C{i, m¿_i, 0) A A C(¿,#, 0), 

2<*<n+l n+l<i<p'(n) 

donde recordemos que s, ff y los Wi son todos números. 

G: Establece, finalmente, que M está en el estado h en el instante p{rí). 

G = S(h,p(n)). 


Teorema 6.1 sat es NP-completo. 

Prueba: Vimos que SAT £ A ÍV. Luego, mostramos cómo reducir polinomialmente cualquier 

L £ MV a SAT: Describimos la construcción de una fórmula proposicional P = f\t tP {w ) que dice 
que existe una computación de M que empieza en la configuración (s, jfwjf) y llega al estado h en 
el paso p{n). Es posible hacer verdadera P (es decir, P £ sat) sii M acepta w (es decir, w £ L). 
Asignar los valores de las variables preposicionales C(i,j,t), y S(k,t) equivale a decir qué 

computación elegiremos que sea válida y termine en el estado h. Si |u>| = n, |P| = 0(p'(n) 3 logn), 
es decir polinomial en |íu|, y puede construirse fácilmente en tiempo polinomial. □ 

Observación 6.7 Esto significa que, si halláramos un método determinístico de tiempo 
polinomial para resolver SAT, inmediatamente podríamos resolver en tiempo polinomial 
cualquier problema en AÍV. Basta construir una MTND AI que lo resuelva, hallar el 
polinomio p(n) que acota el tiempo en que operará, construir la P correspondie7ite a partir de 
M, p y la cadena w que nos interesa saber si está en L, y finalmente determinar en tiempo 
polinomial si P es satis factible. 

Definición 6.10 Una fórmula proposicional está en forma normal conjuntiva (FNC) si 
es una conjunción de disyunciones de literales, sat-fnc es el lenguaje de las fórmulas 
satisfactibles que están en forma normal conjuntiva. 

Lema 6.9 sat-fnc es NP-completo. 

Prueba: Determinar si una fórmula está en FNC es simple, de modo que el verdadero problema 
es saber si es satisfactible. Ya sabemos que SAT es NP-completo, pero podría ser que este caso 
particular fuera más fácil. No lo es. La fórmula P que se construye para SAT está prácticamente en 
FNC, sólo hay que redistribuir algunas fórmulas de tamaño constante en D y E. Por ejemplo, en D, 
debemos convertir x V (y = z), es decir, x V (y A z) V (~ y A ~ z), en (x V y V ~ z) A (x V ~ y V z). 
En el caso de E la fórmula también es de largo constante (independiente d en). □ 
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6.5 Otros Problemas NP-Completos [AHU 74 , sec 10 . 5 ] 

Una vez que tenemos el primer problema NP-completo, es mucho más fácil obtener otros 
mediante reducciones. Veremos sólo unos pocos de los muchos problemas NP-complctos 
conocidos. Los problemas NP-completos se suelen dibujar en un árbol, donde los nodos son 
problemas NP-completos y un nodo u hijo de v indica que una forma fácil o conocida de 
probar que u es NP-completo es reducir v a u. La raíz de este árbol será sat-fnc. 



Repasemos la metodología general para establecer que L es NP-completo: 

1. Mostrar que L G AfV. Esto suele ser muy fácil (¡cuando es verdad!). 

2. Elegir un L' NP-completo para mostrar que L' < L. Esto puede requerir intuición y 
experiencia, pero a veces es muy evidente también. 

(a) Diseñar la transformación polinomial /. Esto suele hacerse junto con la elección 
de I/, y es realmente la parte creativa del ejercicio. 

(b) Mostrar que / se puede calcular en tiempo determinístico polinomial. Esto suele 
ser muy fácil (¡cuando es verdad!). 

(c) Mostrar que w G L' f{w) G L. Esto suele ser difícil, y normalmente va junto 
con el diseño de la /. Notar la implicación doble a demostrar. 
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Comenzaremos con una restricción aún mayor a sat-fnc. 

Definición 6.11 3-SAT es el conjunto de fórmulas proposicionales satisfactibles en FNC, 
donde ninguna disyunción tiene más de 3 literales. 

Teorema 6.2 3-SAT es NP-completo. 

Prueba: Primero, 3-SAT £ AÍV ya que 3-SAT es un caso particular de SAT. Para mostrar que es 
NP-completo, veremos que sat-fnc < 3-SAT. La reducción es como sigue. Sea F = F\ A ... A F q 
la fórmula original en FNC. Transformaremos cada con más de tres literales en una conjunción 
donde cada elemento tenga la disyunción de tres literales. Sea Fi = x\ V x 2 V ... V xk, con Xj 
literal (variable o variable negada). Introduciremos variables nuevas y\ a yk- 3 , y reemplazaremos 
Fj por 


F¡ = {xi V x 2 V yi) A (~ 2/1 V x 3 V 2/2) A (~ 2/2 V x 4 V 2/3) A ... 

A (~ Vk-4 v Xk-2 v yk-3) A (~ y k -3 v x k -i V x k ). 

Está claro que F¡ se puede construir en tiempo polinomial a partir de F¿. Veamos ahora que la 
transformación preserva satisfactibilidad: 

• Si F es satisfactible, existe una asignación de valores a las variables que hace verdadero cada 
Fj,. Dentro de cada F¿, al menos uno de los literales Xj se hace verdadero con esta asignación. 
Conservemos esa asignación para F', y veamos que se puede asignar valores a los y¡ que hagan 
verdadera a F¡. Digamos que 3 < j < k — 2 . Podemos asignar 2/y—2 = 1 y Vj-i = 0 , pues 

(~ ?/y_2 V Xj V 2/y—1) se mantiene verdadero. El valor asignado a 2 /y—2 hace verdadera la 

disyunción anterior, (~ 2/y —3 V x j- 1 V 2 /y—2), lo cual nos permite asignar ?/y—3 = 1 y seguir 

la cadena hacia atrás. Similarmente, el valor asignado a 2/y_1 hace verdadera la disyunción 

siguiente, (~ 2 /y—1 V x j+ 1 V Vj), 1 ° que nos permite asignar 2 /y = 0 y continuar la cadena 
hacia adelante. De modo que las F¡ son satisfactibles también. 

• Si F' = F[ A... A F' q es satisfactible, hay una asignación de variables de F' que hace verdadera 

cada F[. Veremos que no es posible lograr eso si ninguna de las xj se ha hecho verdadera. Si 
todas las Xj se han hecho falsas, entonces 2/1 debe ser verdadera. Pero entonces, para hacer 
verdadera a (~ 2/1 V X3 V 2/2) necesitamos que 2/2 sea verdadera, y así siguiendo, necesitaremos 
finalmente que yk-3 sea verdadera, con lo que la última disyunción, (~ yk-3 V Xk -1 V Xk) 
es falsa. □ 

Veamos ahora un problema NP-completo que no tiene nada que ver con fórmulas 
proposicionales, sino con grafos. 

Definición 6.12 Un /c-clique en un grafo no dirigido G = (V, E) es un subconjunto de V 
de tamaño k donde todos los vértices están conectados con todos. El lenguaje CLIQUE es el 
conjunto de pares (G, k ) tal que G tiene un k-clique. Corresponde al problema de, dado un 
grafo, determinar si contiene un k-clique. 
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Encontrar diques en grafos es útil, por ejemplo, para identificar clusters o comunidades en 
redes sociales, entre muchas otras aplicaciones. Lamentablemente, no es fácil hallar diques. 

Ejemplo 6.5 El siguiente grafo tiene un 3-clique, que hemos marcado. ¿Puede encontrar otro? 
¿Y un 4-clique? 



Teorema 6.3 CLIQUE es NP-completo. 

Prueba: Está claro que CLIQUE € AÍV: Una MTND puede adivinar los k vértices y luego verificar 
en tiempo polinomial que forman un fc-clique. Para ver que es NP-completo, mostraremos que SAT- 
fnc < CLIQUE. Sea F = F\ A ... A F q una fórmula en FNC y sea E¿ = xy i V Xi¿ V ... V 
Construiremos un grafo G = (V, E ) que tendrá un g-clique sii F es satisfactible. 

G tendrá un vértice por cada literal de F, formalmente V = {(¿, j), 1 < i < g, 1 < j < m¿}. 
Y tendrá aristas entre literales de distintas componentes F¿ y F ¿/ que no sean uno la negación del 
otro, formalmente E = {((¿,j), i A i', Xi¿ ^ ~ x i’,j’}- 

Está claro que G se puede construir en tiempo polinomial a partir de F. Veamos ahora que la 
transformación es correcta. 

• Si F es satisfactible, podemos asignar valores a las variables de modo que tengamos al menos 
un literal verdadero x^ v u\ en cada F t . Esos q literales verdaderos no pueden ser ninguno la 
negación del otro, pues se han hecho verdaderos todos a la vez. Como todos esos literales están 
en distintas componentes y no son ninguno la negación del otro, los nodos correspondientes 
están todos conectados en G , formando un g-clique. 

• Si G tiene un g-clique, los literales asociados a los g nodos participantes deben estar todos 
en distintas componentes y no ser ninguno la negación del otro. Eso significa que se pueden 
hacer verdaderos todos a la vez, y tendremos un literal verdadero en cada iq, con lo que F 
puede hacerse verdadera. 

□ 
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Ejemplo 6.6 Tomemos la fórmula del Ej. 6.4 y construyamos el grafo G asociado a ella (con una 
columna por disyunción). Como aquella fórmula de 6 disyunciones es satisfactible, este G tiene al 
menos un 6-clique. Para evitar una maraña ilegible, hemos considerado la asignación de variables 
p = 1, q = 0, r = 0, marcando los nodos que corresponden a literales verdaderos (se hace verdadero 
al menos un nodo en cada columna), y hemos dibujado solamente las aristas entre esos nodos que 
hemos seleccionado (que están todas conectadas con todas, de modo que se forma necesariamente 
al menos un 6-clique). 



Observación 6.8 Notar que, para cualquier k fijo, se puede determinar si G = (' V , E) tiene 
un k-clique en tiempo 0(n k ), lo cual es un polinomio en |G|. Esta solución, sin embargo, 
es exponencial en el largo de la entrada cuando k es un parámetro que puede ser tan grande 
como n. 

El siguiente problema tiene que ver con optimización de recursos. Por ejemplo, ¿cómo 
distribuir faroles en las esquinas de un barrio de modo que todas las cuadras estén iluminadas 
y minimicemos el número de faroles? Supongamos que cada farol alumbra una cuadra, hasta 
la próxima esquina, en todas las direcciones. El problema es fácil si el barrio tiene un trazado 
regular, pero si es arbitrario, es sorprendentemente difícil. 

Definición 6.13 Un recubrimiento de vértices (vertex cover) de tamaño k de un grafo no 
dirigido G = (V, E) es un subconjunto de k nodos de V tal que para toda arista (u,v) G E, 
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al menos uno entre u y v están en el subconjunto elegido. El lenguaje VC se define como los 
■pares (G, k) tal que G tiene un recubrimiento de vértices de tamaño k. 


Teorema 6.4 vc es NP-completo. 

Prueba: Primero, VC € AÍV, pues una MTND puede adivinar los k vértices y luego verificar 
en tiempo polinomial que toda arista incide en al menos un vértice elegido. Para ver que es NP- 
completo, probaremos que CLIQUE < VC. 

Esto es muy sencillo. Sea E' el complemento de las aristas de E. Entonces V' es un dique en 
G = (V, E) sii V — V' es un recubrimiento de vértices en G' = (V, E'). Una vez que nos convenzamos 
de esto, es inmediato cómo reducir: Un G = (V, E) dado tendrá un /¿-dique sii G' = (V, E') tiene 
un recubrimiento de vértices de tamaño \V\ — k. 


• Sea V un dique en G. Sus nodos están todos conectados con todos. Si complementamos 
las aristas de G para formar G' . ahora esos nodos no están conectados ninguno con ninguno. 
Eso significa que los demás vértices, V — V' , cubren todas las aristas de G 1 , pues toda arista 
tiene al menos uno de sus extremos en V — V' (es decir fuera de V'). 

• Sea V —V' un recubrimiento de vértices en G' . Entonces ninguna arista puede tener ambos 
extremos en V' . es decir, conectar dos nodos de V' . Al complementar las aristas para formar 
G, ahora todos los nodos de V' están conectados entre sí, formando un dique. 




□ 


Ejemplo 6.7 Tomemos el grafo del Ej. 6.5 y complementemos las aristas. Como aquél grafo tenía 
un 3-clique y el grafo tiene 7 nodos, este grafo complementado tiene un recubrimiento de vértices 
de tamaño 4 (el complemento de los nodos de aquél dique). ¿Se puede cubrir todas las aristas con 
3 vértices? 
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Veremos ahora un problema que no tiene que ver con grafos. Nuevamente tiene 
aplicaciones en optimización. Supongamos que queremos tener todas las obras de Mozart en 
CDs, pero las obras vienen repetidas en los distintos CDs que están a la venta. Claramente 
no es necesario comprarlos todos para tener todas las obras. ¿Cuál es la mínima cantidad 
de CDs que necesito comprar? Un problema ligeramente más complejo es el de comprar un 
set de productos a mínimo costo dado un conjunto de ofertas de paquetes de productos. 

Definición 6.14 Dados conjuntos Si, S 2 , • • •, S n , un recubrimiento de conjuntos (set cover) 
de tamaño k es un grupo de k conjuntos S' il , S Í2 ,, S ik , tal que Ul <j<A = Ul<i<„Si. 
El lenguaje SC es el de los pares ( S = {Si, S 2 , ■.., S n }, k) tal que S tiene un recubrimiento 
de conjuntos de tamaño k. 

Teorema 6.5 SC es NP-completo. 

Prueba: Es fácil ver que SC € J\ÍV. Una MTND puede adivinar los k conjuntos a unir, unirlos y 
verificar que se obtiene la unión de todos los conjuntos. Para ver que es NP-completo, reduciremos 
VC < SC. 

La reducción es muy simple. Sea un grafo G = (V,E). Asociaremos a cada vértice v € V 
un conjunto S v conteniendo las aristas que tocan v, formalmente S v = {(tt,u) € E} (recordar 
que G no es dirigido, por lo que (u,v) = (v,u)). Evidentemente esto puede hacerse en tiempo 
polinomial. Además no es difícil ver que si {ui, v 2 ,..., v &} es un recubrimiento de vértices de G, 
S V1 , S V2 ,..., S l¡k es un recubrimiento de conjuntos de S, y viceversa. Lo primero dice que toda 
arista tiene al menos un extremo en algún y lo segundo que toda arista está contenida en algún 
S Vi , y ambas cosas son lo mismo porque precisamente S Vi contiene las aristas que inciden en . □ 

Ejemplo 6.8 Tomemos el grafo del Ej. 6.7 y dibujemos los conjuntos de aristas del problema 
correspondiente de SC directamente sobre el grafo. Hemos dibujado solamente los que corresponden 
a la solución del VC en aquél ejemplo. Toda arista está en algún conjunto. 
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Volvamos a problemas en grafos. Un problema de optimización muy común en 
aplicaciones de transporte es el de recorrer un conjunto de sitios a costo mínimo, cuando 
existe un costo arbitrario para ir de cada sitio a otro. El siguiente problema es una 
simplificación de este escenario, la cual ya es NP-completa. 

Definición 6.15 Un grafo dirigido G = (V, E) tiene un circuito hamiltoniano (Hamiltonian 
circuit) si es posible partir de uno de sus nodos y, moviéndose por aristas, ir tocando cada 
nodo de V exactamente una vez, volviendo al nodo original. El lenguaje HC es el de los 
grafos dirigidos G que tienen un circuito hamiltoniano. 

Ejemplo 6.9 ¿Tiene este grafo un circuito hamiltoniano? Cuesta un poco encontrarlo, pero lo 
tiene: 5,2,4,3,1,5. 



Antes de demostrar que HC es NP-completo, estudiemos el siguiente subgrafo: 
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Nótese que, si se entra por la derecha y se sale por la izquierda, o viceversa, siempre 
quedará un nodo excluido del potencial circuito hamiltoniano. De modo que en cualquier 
circuito hamiltoniano que involucre este subgrafo, si el circuito entra por la izquierda debe 
salir por la izquierda, y si entra por la derecha debe salir por la derecha. Si entra por la 
izquierda, puede o no tocar los nodos de la derecha (y viceversa). Con esto estamos listos 
para mostrar que HC es NP-completo. 

Teorema 6.6 HC es NP-completo. 

Prueba: Es fácil ver que HC € J\ÍV: Una MTND puede adivinar la permutación que forma el 
circuito y luego verificar que existe una arista entre cada nodo y el siguiente de la permutación. 
Para ver que es NP-completo, mostraremos que VC < HC. Dado un par (G,k), construiremos un 
grafo dirigido Gd tal que G tendrá un recubrimiento de vértices de tamaño k sii Gd tiene un 
circuito hamiltoniano. 

La construcción es como sigue. Sea G = (V,E). Por cada nodo v € V tendremos una lista 
de nodos en Gd- Por cada arista (u,v) € E pondremos un par de nodos en la lista de u y otro 
par en la lista de v, formando el subgrafo mostrado recién entre esos cuatro nodos. Finalmente, 
agregaremos k nodos ai, « 2 ,..., a*,, de los que saldrán aristas al comienzo de cada una de las V 
listas y a las que llegarán aristas desde el final de cada una de las \V\ listas. 

Está claro que este grafo Gd se puede construir en tiempo polinomial en |G|. Veamos ahora 
que (G, k ) € vc sii Gd £ hc. 

• Si hay k nodos V 2 , ■ ■ ■ , Wfc} C V que cubren todas las aristas, el circuito en Gd pasará por 
las listas que corresponden a los nodos elegidos en V. Comenzaremos por ai, luego pasaremos 
por la lista de v±, al salir iremos a 02 , luego a la lista de v%, y así hasta recorrer la lista de 
Vk y volver a ai. Este circuito recorre todos los nodos de Gd que están en las listas elegidas. 
¿Qué pasa con los nodos en las listas no elegidas? Estos aparecen de a pares, y corresponden 
a aristas que conectan los nodos no elegidos con nodos, necesariamente, elegidos (pues los 
nodos elegidos cubren todas las aristas). Entonces, cada uno de estos pares se puede recorrer 
en el momento en que se pase por el par de nodos correspondiente del vértice elegido. 

• Si Gd tiene un circuito hamiltoniano, cada una de las ai debe aparecer exactamente una vez. 
Debe recorrerse exactamente una lista luego de cada a t . Esas k listas que se recorren son las 
de vértices que necesariamente cubren todas las aristas de G, pues los pares de nodos de las 
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listas no elegidas han sido incluidas en el circuito y eso implica que los otros dos nodos que 
les corresponden están en listas elegidas. □ 

Ejemplo 6.10 Tomemos un pequeño ejemplo de recubrimiento de vértices de tamaño 2, donde 
{1,3} es una solución. Hemos dibujado el problema HC asociado, y el circuito que corresponde 
a seleccionar esos dos vértices. Obsérvese cómo se pasa por los vértices de las listas no elegidas 
cuando es necesario para incluirlos en el circuito. 
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Otro problema importante en grafos es el de colorearlos, es decir asignarle una clase 
(de un conjunto finito) a cada nodo, de modo que nodos adyacentes sean de distinta clase. 
Una aplicación elemental es colorear un mapa, pero se puede usar para modelar cosas como 
distribuir tareas en servidores de modo que algunas tareas (por consumir el mismo tipo de 
recursos) no deberían estar juntas. 

Definición 6.16 Un fc-coloreo de un grafo no dirigido G = (V, E ) es una función c : V —» 
[1 ,k\, tal que si (u,v) G E, entonces c(u ) ^ c{v). El lenguaje COLOR es el conjunto de los 
pares ( G , k) tal que G tiene un k-coloreo. 

El problema es trivial para k — 1 y fácil de resolver polinomialmente para k — 2 ¡inténtelo!, 
pero NP-completo a partir de k = 3. 

Ejemplo 6.11 Considere el grafo del Ej. 6.5. Al tener un 3-clique, está claro que se necesitan 
al menos 3 colores para colorearlo. ¿Basta con tres? Toma algo de trabajo convencerse, pero se 
puede. Una solución es la que sigue. 



Teorema 6.7 COLOR es NP-completo. 

Prueba: Una MTND puede fácilmente adivinar el color a asignar a cada vértice y luego verificar 
en tiempo polinomial que no hay pares conectados del mismo color. Para ver que COLOR es NP- 
completo, mostraremos que 3-SAT < COLOR. 

Supongamos que tenemos una fórmula F = F\ A F-¿ A ... A F g , formada con variables 

preposicionales v±, V 2 , ■ ■ ■, v n . Supondremos n > 4, lo cual no es problema porque con cualquier 

n constante 3-SAT se puede resolver probando todas las combinaciones en tiempo polinomial. O 
sea, si a un conjunto difícil le restamos un subconjunto fácil, lo que queda aún es difícil. Construiremos 
un grafo G = (V. E ) que será coloreable con n + 1 colores sii F es satisfactible. 

G tendrá los siguientes vértices: (i) ~ y x¡, 1 < i < n, donde las son las variables 

preposicionales y son símbolos nuevos, (ii) Fj, 1 < j < q. Las aristas conectarán los siguientes 
pares: (a) todos los ( Xi,x¡ ), i / j; (6) todos los ( Xi,Vj ) y (x¿,~ Vj), i j; (c) todos los (u¿,~ u¿); 
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(d) todos los ( Vi,Fj ) donde Vi no es un literal en Fy, (e) todos los (~ Vi,Fj ) donde ~ no es un 
literal en Fj. 

La construcción no es muy intuitiva, pero obviamente puede hacerse en tiempo polinomial. 
Debemos ver ahora que funciona. Comencemos por algunas observaciones. El n-clique formado 
por los xL s obliga a usar al menos n colores, uno para cada A su vez, los y ~ v t no pueden 
tomar el color de un Xj con j A *• Sí pueden tomar el color de su x¿, pero no pueden hacerlo 
tanto Vi como ~ porque ellos también están conectados entre sí. De modo que uno de los dos 
debe recibir un color más, que llamaremos gris (la intuición es que un literal gris corresponde a 
hacerlo falso). Hasta ahora podemos colorear G con n + 1 colores, pero faltan aún los nodos Fj. Si 
queremos un n + 1 coloreo debemos colorear estas Fj sin usar nuevos colores. 

Como hay al menos 4 variables distintas y las Fj mencionan 3 literales, existe por lo menos 
una variable que no se menciona en Fj. Esto hace que Fj esté conectado con y con ~ y 
por ende no pueda ser coloreada de gris. Los únicos colores que puede tomar Fj corresponden a 
los literales (variables afirmadas o negadas) que aparecen en Fj, pues está conectada con todos los 
demás. Si estos literales son todos grises, como Fj no puede ser gris, se necesitará un color más. 
Si, en cambio, alguno de ellos es de otro color, Fj podrá tomar ese color y no requerir uno nuevo. 


• Supongamos que F es satisfactible. Entonces existe una asignación de valores de verdad a 
las Vi tal que cada Fj contiene un literal que se hizo verdadero. Si coloreamos de gris a las 
y ~ Vi que se hacen falsas, y coloreamos igual que a las y ~ que se hacen verdaderas, 
entonces cada Fj podrá tomar el color no-gris de alguna de las o ~ que aparecen en ella. 
Entonces G será coloreable con n + 1 colores. 


• Supongamos que G se puede colorear con n + 1 colores. Eso significa que podemos elegir cuál 
entre y ~ será del color de su x t (y la otra será gris), de modo que cada Fj contendrá al 
menos un literal coloreado no-gris. Entonces se puede hacer falsos a los literales coloreados 
de gris, y cada Fj tendrá un literal que se haga verdadero. 


□ 


Ejemplo 6.12 No nos sirve el Ej. 6.4 porque sólo tiene 3 variables. Para que nos quede algo 
legible, usaremos F = (p V q) A (~ p V r) A (~ q V ~ r). Este también tiene 3 variables, pero 
sólo 2 literales por disyunción, de modo que sigue valiendo que hay alguna variable que no aparece 
en cada Fj. El grafo que se genera para esta F es el siguiente. El grafo es 4-coloreable porque F 
es satisfactible, por ejemplo con p = 1, q = 0, r = 1. Hemos coloreado el grafo de acuerdo a esa 
asignación de variables. 
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Un problema relevante de conjuntos, parecido al recubrimiento de vértices, es el de cubrir 
el conjunto con subconjuntos sin traslapes. 

Definición 6.17 Dados conjuntos Si, 5*2,..., S n , un recubrimiento exacto (exact cover) 
es un grupo de conjuntos S h , S Í2 , ..., S ik , tal que Ui<j<fc *%,• = Ui<¿<n S í V S i 0 n = 0 
para todo j ^ j'. El lenguaje EC es el de los conjuntos <S = {Si, S 2 ,..., S n } tal que S tiene 
un recubrimiento exacto. 

A pesar de lo que podría esperarse, la reducción más fácil hacia EC no es desde SC sino 
desde color. 

Teorema 6.8 EC es NP-completo. 

Prueba: Es fácil ver que EC € ÁÍV, pues una MTND puede adivinar los conjuntos y luego verificar 
que forman un recubrimiento exacto. Para mostrar que es NP-completo, mostraremos que COLOR 
< EC. 

Dada la entrada ( G = ( V,E),k ) a COLOR, generaremos una entrada para EC de la siguiente 
forma. Los conjuntos de S serán como sigue: (i) para cada v G V y cada 1 < i < k, el conjunto 
S v ¿ = {u} U {(u,v,i), u G V, (u,v) G E}, (ii) para cada (u,v) & Eyl<i<k, el conjunto 
S u , v , t = {(ti, v, ¿)}. La unión de todos los conjuntos es U U (Ex [1, k]). Claramente estos conjuntos 
se pueden construir en tiempo polinomial. Veamos ahora que la transformación es correcta. 
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• Si es posible asignar colores c(v) € [1 ,k\ a cada v G V de modo que no haya nodos del 
mismo color conectados, entonces es posible cubrir S exactamente: elegiremos los conjuntos 
S vA v) para cada v, y después agregaremos los S UjV ¿ que falten para completar el conjunto. 
Está claro que tenemos todos los elementos de V en la unión de estos conjuntos, y también 
los de E x [1, k\ pues agregamos todos los elementos ( u,v,i ) que sean necesarios. Por otro 
lado, no hay intersección en los conjuntos elegidos: claramente no la hay en los S UjV ¿, y 
no la hay en ningún par S VjC í v \ y 5 u , c (u), pues el único elemento que podrían compartir es 
(u,v,c(u)) = (u,v,c(v)), para lo cual c(v) y c(u) deberían ser iguales. Esto es imposible 
porque u y v son adyacentes. 

• Si existe un recubrimiento exacto, debemos haber elegido exactamente un S lhl por cada v € V 

para poder cubrir V. Si no hay traslapes entre estos conjuntos es porque para todo par de 
nodos adyacentes u y v, se han elegido distintos valores de i (pues sino habría un elemento 
repetido ( u,v,i ) entre los conjuntos). Podemos colorear v del color c(y) = i si elegimos S v ¿, 
y tendremos un /c-coloreo (sin nodos adyacentes con el mismo color i). |-| 

Ejemplo 6.13 Reduzcamos el problema de 3-colorear el grafo del Ej. 6.11 a ec. Los conjuntos son 
los siguientes. Hemos ordenado los pares en forma consistente, pues las aristas no tienen dirección. 


5 a ,1 

= 

{a, 

(a,b, 1), 

(a,c, 1), (a,e, 1)} 

5 a ,2 

= 

{a, 

(a, 6,2), 

(a,c,2), (a, e, 2)} 

5a,3 

= 

{a, 

(a, 6, 3), 

(a,c,3), (a,e,3)} 

5 m 

= 

{b, 

(a, b, 1), 

(fe,e, 1), (fe, /, 1)} 

5 m 

= 

{b, 

(a, 6, 2), 

(fe,e,2), (6,/, 2)} 

5 m 

= 

{b, 

(a, 6,3), 

(fe, e, 3), (6,/, 3)} 

5 C , i 

= 

{c, 

(a,c, 1), 

(c, d. 1)} 

5 C ,2 

= 

(c, 

(a,c, 2), 

M, 2)} 

5 C , 3 

= 

{c, 

(a,c, 3), 

(c, d, 3)} 

5 d ,i 

= 

{d, 

(c, d, 1), 

(d,e, 1), (d,5,l), (c¿, /, 1)} 

S d ,2 

= 

{d, 

(c, d, 2), 

(d,e,2), (d, 5 ,2), ( 0 ?, /, 2)} 

co 

= 

{d, 

(c, d, 3), 

(d,e,3), (d,g, 3), (d,/,3)} 

5 e ,l 

= 

{P 

(a,e, 1), 

(fe, e, 1), (d,e,l), (e, 5 ,l)} 

5 e ,2 

= 

{e, 

(a,e,2), 

(fe,e,2), (d,e, 2), (e, 5 , 2 )} 

5 e ,3 

= 

{e, 

(a,e, 3), 

(fe,e,3), (d,e, 3), (e,5,3)} 

Sf, i 

= 

{/, 

(b, /, 1), 

(d, /, 1)} 

Sf, 2 

= 

{/, 

(b,f, 2), 

(d,/,2)} 

4? 

CO 

= 

{/, 

(&,/,3), 

(d,/,3)} 

Sg,l 

= 

{9, 

(&,5,1), 

(d,£f, 1), (e,p, 1)} 

Sg, 2 

= 

Í9i 

(fe,5,2), 

(d,g,2), (e,g, 2)} 

CO 

= 

{9, 

(fe, 5, 3), 

(d,g,3), (e,p,3)} 
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además de todos los conjuntos {(x, y , i)} para cada arista (x, y) de E y color 1 < i < k. La solución 
correspondiente al coloreo que hemos dado, identificando el color de a con 1, el de b con 2, y el de 
c con 3, correspondería a elegir S a , i, <Sfo,2, S Ct 3, Sd, 2 , Se, 3 , <S/,i, S 9t i, más todos los {(x,y,i)} que 
falten para completar E x {1,2,3}. 

Otro problema de optimización importante, con aplicaciones obvias a, por ejemplo, 
transporte o almacenamiento de mercancías, es el de la mochila (también llamado suma de 
subconjuntos). Se trata de ver si es posible llenar exactamente una mochila (unidimensional) 
eligiendo objetos de distinto tamaño de un conjunto. La versión bidimensional (mucho más 
difícil intuitivamente) tiene aplicaciones a corte de piezas en láminas de madera, por ejemplo. 

Definición 6.18 El problema de la mochila (knapsack) es el de, dado un multiconjunto 
finito de números naturales y un natural K, determinar si es posible elegir un subconjunto 
de esos números que sume exactamente K. El lenguaje knapsack es el de los pares ( S,K) 
tal que un subconjunto de S suma K. 

Ejemplo 6.14 ¿Es posible llenar exactamente una mochila de tamaño 50 con objetos del conjunto 
(de tamaños) {17, 22,14, 6,18,25,11,17,35,45}? No es fácil encontrar la respuesta, pero existe una 
solución: 22 + 11 + 17. 

Teorema 6.9 knapsack es NP-completo. 

Prueba: Una MTND puede adivinar el subconjunto correcto y sumarlo, por lo que el problema 
está en J\ÍV. Para ver que es NP-completo, mostraremos que EC < knapsack. 

La idea es partir de una entrada a EC S = {áj, S2 ,..., S n }, con S = Ui<¿< n S¿ = 
{xo, xi,..., x m }. Identificaremos cada elemento Xj con el número 2 ÍJ ", para t = |~log 2 (n + 1)]. 
A cada conjunto S t = {xq, x¿ 2 ,..., x¿ } le haremos corresponder el número iV¿ = 2 tn + 
2 tl2 + ... + 2 Um i. Nuestro problema de knapsack es entonces ({Ni, IV2 ,..., N n },K), con 
K = 2° + 2 í + 2 2í + . . .+ 2 mí . El largo de la entrada a knapsack es 0(nmt) que es polinomial en |<S|, 
y no es difícil construir esta entrada en tiempo polinomial. Veremos ahora que la transformación 
es correcta. 

• Supongamos que existen conjuntos S { 1 , 5¿ 2 ,..., Si k que cubren S exactamente. Entonces, 
cada Xj aparece exactamente en un , por lo que al sumar + iVj 2 + ... + Ni k el sumando 
2 tj aparece exactamente una vez, para cada j. No hay otros sumandos, de modo que la suma 
de los Ni r es precisamente K. 

• Supongamos que podemos sumar números + 1V¿ 2 + ... + V¿ fc = K. Cada uno de los 
términos 2 tj de K se pueden obtener únicamente mediante incluir un Ni r que contenga 2 tj , 
pues sumando hasta n términos 2h-VL se obtiene a lo sumo n2 í b _1 ) = 2 í b~ 1 H 1 °g2 n < 2 ÍJ . 
Similarmente, si incuyéramos sumandos 7V¿, r que contuvieran un 2 tj repetido, sería imposible 
deshacernos de ese término 2 ÍJ+1 que no debe aparecer en K, pues ni sumándolo n veces 
llegaríamos al 2 í b +1 ). Por lo tanto, cada término 2 ^ debe aparecer exactamente en un 7V¿ r , 
y entonces los Si r forman un recubrimiento exacto. 
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Ejemplo 6.15 Tomemos el siguiente problema de EC: {a, b, c}, {a, b, e}, {b, d}, {c,e}, {c, d}, 
que tiene solución {a, b , e}, {c, d}. En este caso n = 5 y por lo tanto t = 3. Asociaremos 2 o a a, 2* 
a b, y así hasta 2 4í a e. Es ilustrativo escribir los números N t en binario: 


Ni 

= 000 000 001 001 001 

= 73 

n 2 

= 001 000 000 001 001 

= 4105 

n 3 

= 000 001 000 001 000 

= 520 

n 4 

= 001 000 001 000 000 

= 4160 

n 5 

= 000 001 001 000 000 

= 576 

I< 

= 001 001 001 001 001 

= 4681 


y efectivamente obtenemos K = 4681 sumando N 2 + IV 5 = 4105 + 576. 

6.6 La Jerarquía de Complejidad [AHU 74 , sec 10.6 y cap 11 ] 

Terminaremos el capítulo (y el apunte) dando una visión superficial de lo que hay más 
allá en el área de complejidad computacional. 

Notemos que, en todos los problemas NP-completos vistos en la sección anterior, siempre 
era fácil saber que el problema estaba en AÍV porque una MTND podía adivinar una solución 
que luego se verificaba en tiempo polinomial. Esto que se adivina se llama certificado: es una 
secuencia de símbolos que permite determinar en tiempo polinomial que w G L (por ejemplo 
la permutación de nodos para CH, el conjunto de números a sumar para KNAPSACK, etc.). 
Todos los problemas de J\ÍV tienen esta estructura: se adivina un certificado que después se 
puede verificar en tiempo polinomial (esto es general: un certificado válido para cualquier 
MTND es el camino en el árbol de configuraciones que me lleva al estado en que se detiene 
frente a w). El problema en una MTD es que no es fácil encontrar un certificado válido. 

Pero ¿qué pasa con los complementos de los problemas que están en MV1 Por ejemplo, si 
quiero los gratos dirigidos que tienen un circuito hamiltoniano, me puede costar encontrar el 
circuito, pero si me dicen cuál es, me convencen fácilmente de que G G CH. Pero si quiero los 
gratos dirigidos que no tienen un circuito hamiltoniano, ¿qué certificado me pueden mostrar 
para convencerme de que no existe tal circuito? ¿Puede una MTND aceptar los gratos que 
no tienen un circuito hamiltoniano? ¿Los complementos de lenguajes en J\ÍV están en AfVl 
Es intrigante que esta pregunta no tiene una respuesta fácil, hasta el punto de que se define 
la clase co-J\ÍV para representar estos problemas. 

Definición 6.19 La clase co-A ÍV es la de los lenguajes cuyo complemento está en AÍV. 

Nótese que esto tiene que ver con la estructura asimétrica de la aceptación por una 
MTND: acepta si tiene forma de aceptar. Esto hace que sea difícil convertir una MTND 
que acepte un lenguaje L en otra que acepte L c , incluso si estamos hablando de aceptar en 
tiempo polinomial. Esto no ocurre en V, el cual es obviamente cerrado por complemento. 
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Como los complementos de los lenguajes en V sí están en V, tenemos que V C J\ÍV D co- 
J\ÍV. Se cree que AÍV ^ co-AÍV y que ambos incluyen estrictamente a V, aunque esto sería 
imposible si V = AÍV. Si AÍV ^ co-AÍV, puede mostrarse que un problema NP-completo no 
puede estar en co-AÍV, y un problema co-NP-completo (que se define similarmente) no puede 
estar en AÍV. Por ello, si un problema está en AÍV D co-AÍV, se considera muy probable 
que no sea NP-completo. 

El ejemplo favorito de un problema que estaba en AÍV fl co-AÍV pero no se sabía si 
estaba en V era el lenguaje de los primos, pero éste se demostró polinomial el año 2004. 

Otra pregunta interesante es si hay problemas que no se sepa si son NP-completos ni si 
están en V. Hay pocos. Uno de ellos es el isormorfismo de grafos: Dados gratos G y G' del 
mismo tamaño, determinar si es posible mapear los nodos de G a los de G' de modo que las 
aristas conecten los mismos pares, (u,v) (/(tí), f(v)) G E'. 

Existe una clase natural que contiene a todas éstas, y tiene que ver con el espacio, no el 
tiempo, que requiere una MT para resolver un problema. Llamaremos P-time y A/"P-t irire a 
las clases V y AÍV, para empezar a discutir el espacio también. 

Definición 6.20 La clase V-space es la de los lenguajes que pueden decidirse con una MTD 
usando una cantidad de celdas de la cinta que sea un polinomio del largo de la entrada. 

Está claro que P-time C P-space, pues una MTND no puede tocar más celdas distintas 
que la cantidad de pasos que ejecuta (más las n + 2 que ya vienen ocupadas por la entrada, 
pero eso no viene al caso). Más aún: como la simulación de una MTND con una MTD 
requería espacio polinomial en el usado por la MTND (Sección 4.5), resulta que A/’P-time 
C P-space, y lo mismo co-A/P-time (el cual no parece que se pueda decidir en tiempo 
polinomial con una MTND, pero sí en tiempo exponencial con la simulación de la MTND 
de la Sección 4.5, pues basta responder lo contrario de lo que respondería la simulación 
determinística). Sin embargo, no se sabe si P-time ^ P-space. Existe incluso el concepto 
de Pspace-complcto. 

Definición 6.21 Un lenguaje es Pspace-completo si pertenece a V-space y, si es decidido 
en tiempo T(n) por una MTD, entonces todo otro problema en V-space se puede decidir en 
tiempo T(p(n)) para algún polinomio p(n). 

Está claro que si se encuentra una solución determinística de tiempo polinomial para un 
problema Pspace-completo, entonces P-time = P-space = A/"P-time = co-AÚP-time. Esto 
se ve aún más improbable que encontrar que P-time = A/"P-time. 

LIn término no demasiado importante pero que aparece con frecuencia es NP-hard : son 
los problemas tales que todos los AÍV reducen a ellos, pero que no están necesariamente 
en AÍV, de modo que pueden incluir problemas intratables incluso con una MTND. Es 
interesante que, a diferencia de lo que ocurre con P y AÍV, sí es posible demostrar que 
existe una jerarquía estricta en términos de espacio y de tiempo, incluyendo problemas que 
demostrablemente requieren espacio y tiempo exponencial. La mayoría de los problemas 
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interesantes están realmente en AfV, y no se sabe si requieren tiempo exponencial en una 
MTD, por eso la importancia del problema abierto ¿P AfVI Sin embargo, podemos 
mostrar un problema relativamente natural que es efectivamente difícil. 

Teorema 6.10 El problema de determinar, dada una expresión regular R de largo |f?| = n, 
si C(R) = £*: 

• Es Pspace-completo con los operadores usuales para expresiones regulares (Def. 2.1). 

• Requiere espacio exponencial en n (y por lo tanto tiempo exponencial en MTD 
o MTND) si permitimos el operador de intersección al definir R (además de la 
concatenación, unión y clausura de Kleene). Estas expresiones regulares se llaman 
semiextendidas. 

2 n 

2 2 ' 

• Requiere espacio superior a 2 2 , para cualquier cantidad fija de 2’s, si además 

de la intersección permitimos la operación de complementar una expresión regular. 
Estas expresiones regulares se llaman extendidas y esas complejidades se llaman no 
elementales. 

Prueba: Ver [AHU74, sec 10.6, 11.3 y 11.4]. □ 

La jerarquía de complejidad en espacio está expresada en el siguiente teorema, donde 
puede verse que es bien fina, por ejemplo se distingue espacio n del espacio n log log n. 

Teorema 6.11 Sean f(n ) > n y g(n) > n dos funciones tal que lim n _ >00 = 0. Entonces 

existen lenguajes que se pueden reconocer en espacio g(n ) y no se pueden reconocer en espacio 
f(n), usando MTDs. 

Prueba: Ver [AHU74, sec 11.1]. □ 

El resultado es ligeramente menos fino para el caso del tiempo. 

Teorema 6.12 Sean f(n ) > n y g(n ) > n dos funciones tal que lim n _ >OQ = 0. 

Entonces existen lenguajes que se pueden reconocer en tiempo g(n) y no se pueden reconocer 
en tiempo f(n), usando MTDs. 

Prueba: Ver [AHU74, ejercicios cap 11] (no resueltos), o [LP81, sec 7.7], para el caso más simple 
donde linp^oo = 0. □ 

En el caso de las MTNDs los resultados son bastante menos finos: hay cosas que se 
pueden resolver en tiempo (o espacio) n k+l pero no en tiempo n k , para cada entero k > 0 . 

Esto implica, por ejemplo, que existen problemas que se pueden resolver en tiempo 2” 
en una MTD y que definitivamente no están en V (ni en AÍV). Nótese que no se sabe gran 
cosa sobre la relación entre espacio y tiempo, más allá de lo mencionado: Todo lo que se 
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pueda hacer en tiempo T(n) (determinístico o no) se puede hacer en espacio T(n), pero en 
particular no se sabe mucho de en qué tiempo se puede hacer algo que requiera espacio S(n). 
El siguiente esquema resume lo principal que hemos visto. 



Para terminar, algunas notas prácticas. En la vida real, uno suele encontrarse con 
problemas de optimización más que de decisión. Por ejemplo, no queremos saber si 
podemos iluminar el barrio con 40 faroles (ve) sino cuál es el mínimo número de faroles 
que necesitamos. Normalmente la dificultad de ambas versiones del problema es la misma. 
Si uno puede resolver el problema de optimización, es obvio que puede resolver el de decisión. 
Al revés es un poco más sutil, pues debo hacer una búsqueda binaria en el espacio de las 
respuestas: preguntar si me alcanzan 40 faroles; si me alcanzan, preguntar si me alcanzan 20; 
si no me alcanzan, preguntar si me alcanzan 30; y así. El tiempo se incrementa usualmente 
sólo en forma polinomial. 

Otro tema práctico es: ¿qué hacer en la vida real si uno tiene que resolver un 
problema NP-complcto? Si la instancia es suficientemente grande como para que esto tenga 
importancia práctica (normalmente lo será), se puede recurrir a algoritmos aproximados o 
probabilísticos. Los primeros, para problemas de optimización, garantizan encontrar una 
respuesta suficientemente cercana a la óptima. Los segundos, normalmente para problemas 
de decisión, se pueden equivocar con una cierta probabilidad (en una o en ambas direcciones). 
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Por ejemplo, si la mitad de las ramas del árbol de configuraciones de una MTND me lleva a 
detenerme (o a obtener certificados válidos), entonces puedo intentar elecciones aleatorias en 
vez de no detcrminísticas para obtener certificados. Si lo intento k veces, la probabilidad de 
encontrar un certificado válido es 1 — l/2 k . Sin embargo, no siempre tenemos esa suerte. En 
particular, existe otra jerarquía de complejidad que se refiere a cuánto se dejan aproximar los 
problemas NP-completos. Algunos lo permiten, otros no. En los proyectos se dan algunos 
punteros. 


6.7 Ej ercicios 

1. Suponga que L v < L 2 y que V ^ AfV. Responda y justifique brevemente. 

(a) Si L i pertenece a V, ¿L 2 pertenece a VI 

(b) Si L 2 pertenece a V, ¿Li pertenece a V‘! 

(c) Si Li es A/’P-Completo, ¿es L 2 a AfV- Completo? 

(d) Si L 2 es APP-Completo, ¿es Li a AfV- Completo? 

(e) Si L 2 < Li, ¿son Li y L 2 A/’P-Completos? 

(f) Si Li y L 2 son APp-Completos, ¿vale L- 2 < L i ? 

(g) Si Li pertenece a AfV, ¿es L 2 A/’P-Completo? 


2. Considere una fórmula booleana en Forma Normal Disyuntiva (FND) (disyunción de 
conjunciones de literales). 

(a) Dé un algoritmo determinístico polinomial para determinar si una fórmula en 
FND es satisfactible. 

(b) Muestre que toda fórmula en FNC se puede traducir a FND (leyes de Morgan, 
primer año). 

(c) ¿Por qué entonces no vale que SAT-FNC < SAT-FND y V = AfV ? 

3. Muestre que las siguientes variantes del problema CH también son NP-completas. 

• El grato es no dirigido. 

• El camino no necesita ser un circuito (es decir, volver al origen), pero sí pasar por 
todos los nodos. 

• El grafo es completo (tiene todas las aristas) y es no dirigido, pero cada arista 
tiene un costo c(u, v) > 0 y la pregunta es si es posible recorrer todos los nodos 
(aunque se repitan nodos) a un costo de a lo sumo C. Este es el problema del 
ve?idedor viajero o viajante de comercio. 
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4. Use CLIQUE para mostrar que los siguientes problemas son NP-complctos. 

• El problema del conjunto independiente máximo (máximum independent set) es, 
dado un grato G = (V, E) y un entero k < \V\, determinar si existen k nodos en 
G tales que no haya aristas entre ellos. 

• El problema de isomorfismo de subgrafos es, dados gratos no dirigidos G y G ', 
determinar si G' es isomorfo a algún subgrafo de G. Un subgrafo de G se obtiene 
eligiendo un conjunto de vértices y quedándose con todas las aristas de G que 
haya entre esos nodos. 

• El mismo problema anterior, pero ahora podemos elegir algunas aristas, no 
necesariamente todas, al generar el subgrafo de G. 

5. Parta de knapsack para demostrar que los siguientes problemas son NP-completos. 

(a) El problema de partición de conjuntos (set partition) es, dados dos conjuntos de 
naturales, ¿es posible dividirlos en dos grupos que sumen lo mismo? 

(b) El problema de empaquetamiento (bin packing) es, dado un conjunto de números y 
un repositorio infinito de paquetes de capacidad K , ¿puedo empaquetar todos los 
ítems en a lo sumo k paquetes sin exceder la capacidad de los paquetes? Reduzca 
de set partition. 

6 . El problema del camino más largo en un grato no dirigido G es determinar si G tiene un 
camino de largo > k que no repita nodos. Muestre que este problema es NP-completo. 

7. Considere la siguiente solución al problema de la mochila, usando programación 
dinámica. Se almacena una matriz 7L[0..n, 0..ÍÚ], de modo que A[i,j] = 1 sii es 
posible sumar exactamente j eligiendo números de entre los primeros i de la lista 
Afi, ?V 2 ,..., N n . 

(a) Muestre que A[i + 1, j] = 1 sii = 1 ó A[i,j — -/V¿ +1 ] = 1. 

(b) Muestre que A se puede llenar en tiempo 0(nK ) usando la recurrencia anterior, 
de modo de resolver el problema de la mochila. 

(c) ¿Esto implica que V = A ÍVI 

8 . El problema de programación entera tiene varias versiones. Una es: dada una matriz 
A de n x m y un vector b de n filas, con valores enteros, determinar si existe un vector 
x de m filas con valores 0 ó 1 tal que Ax = b. Otra variante es Ax < b (la desigualdad 
vale fila a fila). Otras variantes permiten que x contenga valores enteros. 

(a) Muestre que la primera variante que describimos (igualdad y valores de x en 0 y 
1) es NP-completa (reduzca de knapsack). 
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(b) Muestre que la variante que usa < en vez de = es NP-completa (generalice la 
reducción anterior). 

(c) Muestre que la variante con < y valores enteros para x es NP-completa (reduzca 
de la anterior). 


6.8 Preguntas de Controles 

A continuación se muestran algunos ejercicios de controles de años pasados, para dar una 
idea de lo que se puede esperar en los próximos. Hemos omitido (i) (casi) repeticiones, (ii) 
cosas que ahora no se ven, (iii) cosas que ahora se dan como parte de la materia y/o están 
en los ejercicios anteriores. Por lo mismo a veces los ejercicios se han alterado un poco o se 
presenta sólo parte de ellos, o se mezclan versiones de ejercicios de distintos años para que no 
sea repetitivo. En este capítulo en particular, para el que no existían guías previas, muchas 
de las preguntas de controles son ahora ejercicios, por eso no hay tantas aquí. Además este 
capítulo entró en el curso en 1999. 

Ex 2000 Dibuje una jerarquía de inclusión entre los siguientes lenguajes: aceptables, 
decidibles, finitos, libres del contexto, regulares, V, y ÁÍV. Agregue también los 
complementos de los lenguajes en cada clase: los complementos de lenguajes finitos, los 
complementos de lenguajes regulares, etc. No confunda (por ejemplo) “complementos 
de lenguajes regulares” con “lenguajes no regulares”. ¡Se pide lo primero! 

Ex 2001 Un computador cuántico es capaz de escribir una variable binaria con ambos 
valores (0 y 1) a la vez, y la computación se separa en dos universos paralelos que 
no pueden comunicarse entre sí. Esto puede hacerse repetidamente para obtener 
secuencias de bits, subdividiendo las computaciones. Cada computación prosigue en su 
universo individual hasta que termina. El estado final del cálculo es una superposición 
cuántica de los resultados de todas las computaciones realizadas en paralelo. Luego, 
con un computador tradicional, es posible desentrañar algunos resultados en tiempo 
polinomial. En particular se puede descubrir si una determinada variable booleana 
está en cero en todos los resultados o hay algún 1. 

La construcción real de computadores cuánticos está muy en sus comienzos. 
Suponiendo que esto se lograra, responda las siguientes preguntas, y si la respuesta 
es sí, indique qué impacto práctico tendría eso en el mundo. 

(i) ¿Se podría decidir algún problema actualmente no decidible? 

(ii) ¿Se podría aceptar algún problema actualmente no aceptable? 

(iii) ¿Se podría resolver rápidamente algún problema AiP-completo? 

Ex 2003 Responda verdadero o falso a las siguientes afirmaciones, justificando en a lo sumo 
3 líneas. Lina respuesta sin justificación no tiene valor. 
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Sean P\ y P 2 problemas (es decir, lenguajes). 

(a) Si P\ < P 2 y P 2 es NP-completo, entonces P\ es NP-completo. 

( b ) Si P\ y P 2 son NP-completos, entonces P\ < P 2 J P 2 < P. 

( c ) Si P\ está en V, y P 2 < Pi, entonces P 2 está en V. 

( d ) Si Pi está en J\ÍV y P\ < P 2 , entonces P 2 está en J\ÍV. 

(e) Si P 2 está en A/"P, Pi es NP-completo y P\ < P 2 , entonces P 2 es NP-completo. 
(/) Si Pi es NP-completo, entonces es decidible. 

Ex 2005 Los extraterrestres nos entregan una esfera metálica que recibe como entrada la 
descripción de una Máquina de Turing M y un input para M (en tarjetas perforadas). 
En menos de tres segundos la esfera se ilumina de verde si M se detiene frente a ese 
input y rojo sino. La esfera cambia la teoría de la computabilidad, porque 

(a) Todos los problemas de decisión se vuelven computables. 

( b ) Todos los lenguajes aceptables pasan a ser decidibles. 

(c) Todos los lenguajes decidibles pasan a ser libres del contexto. 

(d) Todos los problemas de AÍV pasan a estar en V. 

En cada una de las opciones indique si es cierto o falso, argumentando. 

Ex 2005 El profesor Locovich descubre un algoritmo polinomial para resolver el A;-coloreo. 
Explique paso a paso cómo utilizaría ese algoritmo para resolver el problema del circuito 
hamiltoniano en tiempo polinomial, con las herramientas que usted conoce. 

Ex 2005 Dado un conjunto de conjuntos {Sj, S 2 , ■ ■ ■, S n } y un número 1 < k < n, llamemos 
C = S 1 US 2 ■ ■ - OS n . Queremos saber si existe un S C C tal que |Sj = k y que S contenga 
algún elemento de cada Si, para todo 1 < i < n. 

Demuestre que el problema es NP-completo (hint: use vertex cover). 

Ex 2006 Considere la MT robotizada del ejercicio Ex 2006 del capítulo 4. 

• Si tomáramos esta MT como un modelo válido de computación, ¿cambiaría el 
conjunto de lenguajes aceptables? ¿el de los lenguajes decidibles? ¿el estatus de 
A/ÓP? 

• ¿Existen ejemplos del mundo real que se puedan asimilar, con cierta amplitud de 
criterio, a este modelo de computación? 

Ex 2007 Una anciana regala sus joyas a sus dos hijos, quienes tendrán que repartírselas de 
la forma más equitativa posible. Son n joyas, tasadas en v\... v n pesos. 
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1. Demuestre que el problema de saber si los hijos se pueden repartir las joyas en 
forma perfectamente equitativa es NP-completo. Ayuda: Considere el problema 
de la mochila (x\.. .x n , con suma K), agregando un elemento adicional 2 K — 
]>0” =1 x t . ¿Y si este nuevo valor fuera negativo? 

2. Extienda su solución a m > 2 hijos. 

3. Ahora que tiene que el problema es NP-completo para todo m, resulta que el 
problema es obviamente polinomial para m = n. Explique esta incongruencia. 


6.9 Proyectos 

1. Sólo hemos cubierto un pequeño conjunto de problemas NP-complctos 
representativos. Hemos dejado fuera algunos muy importantes. Es bueno 
que dé una mirada a los cientos de problemas NP-completos que se 
conocen. Puede ver, por ejemplo, el excelente libro [GJ03] o, en su defecto, 

http: //en. wikipedia. org/wiki/List_of _NP-complete_problems. 

2. Investigue sobre algoritmos de aproximación para problemas NP-completos (realmente 
de optimización), y qué problemas se dejan aproximar. Una buena referencia es 
[ACG+99]. También hay algo en [CLRS01, cap 35] y en [GJ03, cap 6]. 

3. Investigue sobre algoritmos probabilísticos o aleatorizados, en particular para resolver 
problemas NP-completos, y qué problemas se dejan resolver probabilísticamente. Una 
buena referencia es [MR95], y hay algo de material en [HMU01, sec 11.4]. 

4. Investigue más sobre la jerarquía de complejidad. Además de las referencias que 
ya hemos usado, [AHU01, cap 10 y 11] y [LP81, cap 7] (los cuales hemos resumido 
solamente), hay algo en [HMU01, cap 11], en [DW83, cap 13 a 15], y en [GJ03]. 

5. Investigue sobre técnicas para resolver en forma exacta problemas NP-completos, de 
la mejor forma posible en la práctica. Una fuente es [AHU83, sec 10.4 y 10.5]. 
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